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Nitrilhydratasen aus Metagenombibliotheken 

Die vorliegende Erfindung ist auf spezielle degenerierte 
Primer gerichtet. Diese werden vorzugsweise in einera 
Verfahren zur Herstellung von Nitrilhydratasen eingesetzt. 
Gegenstand der vorliegenden Erfindung sind daher auch die 
durch das miter Zuhilfenahme der Primer durchgefiihrte 
Verfahren hergestellten Nitrilhydratasen und weitere fur 
deren Aktivitat benotigte Proteine. Ebenso bilden die diese 
Proteins equenz en codierenden Nukleinsauren und diese 
aufweisenden Expressionssysteme einen weiteren Gegenstand 
der Anmeldung. Die Verwendung der Nitrilhydratasen und der 
zugrundeliegenden Nukleinsaures equenz en bilden einen 
weiteren Aspekt der vorliegenden Erfindung. 

Die Strukturklassen der Amide und Carbonsauren gewinnen 
mehr und mehr an Bedeutung als Vorstufen von 

Feinchemikalien. Spezielle Aminoamide und (proteinogene und ■ 
nicht-proteinogene) Aminosauren sind Schlusselintermediate 
fur die Synthese von pharmazeutischen und agrochemischen 
Produkten, als auch im Lebensmittelbereich. Insbesondere 
enantiomerenreine Amide und Aminosauren spielen eine immer 
grofier werdende Rolle in den oben genannten 
Anwendungsbereichen . 

Aminonitril-Vorstufen, wie sie fur die Herstellung der oben 
angegebenen Verbindungsklassen benotigt werden, sind in 
racemischer Form leicht iiber die so genannte 
Strecker synthese zuganglich. Die so gewonnenen Nitrile 
konnen anschliefiend mittels chemischer oder enzymatischer 
Verseifung in die entsprechenden Amide und Carbonsauren 
uberfuhrt werden. 

ES sind drei Enzyme bekannt, die an der enzymatischen 
Hydrolyse von Nitrilen beteiligt sein konnen. Nitrilasen 
setzen eine Nitril-Funktion direkt zur Saure urn, wohingegen 
Nitrilhydratasen (E.C. 4.2.1.84) hier das entsprechende 
Amid bilden. Dieses kann durch eine Amidase (E.C. 3.5.1.4) 
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abschlieSend in die entsprechende Carbonsaure umgesetzt 
werden (Schema 1) . 



Niteittiydratese Amidase 




4-NH4 



Nitrllase 

Schema 1 : 



Die Verseifung von Nitrilen zu den entsprechenden Amiden 
und Sauren mittels isolierter Enzyme oder Ganz-Zell- 
Katalysatoren hilft grofie Mengen Salz zu sparen, welche 
ansonsten bei dem Neutralisierungsschritt nach der 
chemischen Verseifung von Nitrilen anf alien wiirden. Aus 
diesem Grund stellt die enzymatische Verseifung von 
Nitrilen zu z.B. Aminoamiden und/ oder Aminosauren ein 
nachhaltigeres Produktionsverf ahren dar . 

Nitrilhydratasen bestehen in ihrer aktiven Form aus 2 
nicht-homologen a- und p-Untereinheiten . Diese bilden 
Heterodimere, Tetramere, und bei Rhodococcus rhodochrous J: 
wurden sogar Decamere nachgewiesen . Die a- und |3- 
Untereinheiten besitzen ungefahr die gleiche GroEe, haben 
aber sonst keine Ahnlichkeiten untereinander . 
Nitrilhydratasen sind Metalloproteine die Fe3 + oder Co3 + - 
ionen enthalten (Bunch A. W. (1998), Nitriles, in: 
Biotechnology, Volume 8a, Biotransformations I, Chapter 6, 
Eds.: Rehm HJ, Reed G, Wiley-VCH, p. 277-324; Shearer J, 
Kung IY, Lovell S, Kaminsky W, Kovacs JA (2 001) Why is 
there a "inert" metal center in the active site of ni trile 
hydratase? Reactivity and ligand dissociation from a five- 
coordinate Co (III) nitrile hydratase model. J Am Chem Soc 
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123: 463-468; Kobayashi M, Shimizu S (2000) Nitrile 
hydrolases. Current Opinion in Chemical Biology 4: 95-102). 

Eine der grSSten Heraus f orderungen bisher ist die 
heterologe Darstellung von Nitrilhydratasen in einem 
geeigneten Wirt, bevorzugt in E. coli. Dieses Gram negative 
Bakterium ist bekannt fur seine hohen Expressionsraten 
heterologer Proteine. Ein weiterer Vorteil ist die Ausbeute 
an Biomasse in Hoch-Zelldichte-Fermentationen mit E. coli. 
Hierbei konnen Produktivitaten von ttber 100 g 
Biotrockenmasse (BTM) in 24 bis 44 Stunden erreicht werden 
(Lee SY (199 6) High cell-density culture of Escherichia 
coli. TIBTECH 14:98-105; Riesenberg D, Guthke R (1999) 
High- cell -density cultivation of microorganisms. Appl 
Microbiol Biotechnol 51:422-430). 

Die meisten Nitrilhydratase-Sequenzen der a- und p- 
Untereinheit sind aus der Gattung Rhodococcus bekannt. Aber 
gerade die Expression der Nitrilhydratasen aus dieser 
Gattung in E. coli war bisher nur unter besonderen 
Schwierigkeiten mSglich (Ikehata O, Nishiyama M, Horinouchi 
S, Beppu T (1989) Primary structure of nitrile hydratase 
deduced from the nucleotide sequence of a Rhodococcus 
species and ist expression in Escherichia coli. Eur J 
Biochem 181: 563-570). 

In der Literatur sind Expressionssysteme fur 
Nitrilhydratasen beschrieben deren spezifische Aktivitaten 
zwischen 4,2 und 12,2 U/mg Gesamtprotein fur Co-abhangige 
Nitrilhydratasen aus JR. rhodochrous Jl (Kobayasjhi M, 
Nishiyama M, Nagasawa T, Horinouchi S, Beppu T, Yamada H 
(1991) Cloning, nucleotide sequence and expression in 
Escherichia coli of two cobalt -containing nitrole hydratase 
genes from Rhodococcus rhodochrous. Biochim Biophys Acta 
1129: 23-33) und 452 U/mg Gesamtprotein fur eine eisen- 
abhangige Nitrilhydratase aus Rhodococcus spec. N-771 
liegen (Njori M, Yohda M, Odaka M, Matsushita Y, Tsujimura 
M Yoshida T, Dohmae N, Takio K Endo I (1999) Functunal 
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expression of Nitrile hydratases in E. coli: Requirement of 
a nitrile hydratase activator and a post-translational 
modification of a ligand cysteine. J Biochem 125: 696-704), 
was ungefahr ca. 248 U/mg BTM (Biotrockenmasse) entspricht 
(Kalkulation nach Goodsell DS (1991) Inside a cell. TIBS 
16: 203-206). Interessanterweise konnte die letztgenannte 
Aktivitat mit Nitrilhydratasen aus R. erythropolis , welche 
nahe verwandt sind mit Rhodococcus spec. N-711, mit 
ahnlichen Vektorsystemen und Anordnungen der Strukturgene 
nicht nachvollzogen werden. Es bestand daher immer noch ein 
Bedarf an Verfahren und Systemen welche es gestatten, die 
ins Auge gefassten Enzyme in fur technische MaSstabe 
ausreichender Art und Weise zur Verfugung zu stellen. 

Bisher beschriebene Methoden des Screenings nach 
Nitrilhydratasen beschrankten sich auf die Isolierung von 
Mikroorganismen, die eine entsprechende Enzymaktivitat 
aufweisen. Diese Mikroorganismen wurden entweder aus 
bestehenden Stammsammlungen entnommen, oder in so genannten 
Anreicherungsmedien selektiv angezogen (Colquhoun JA, Heald 
SC, Li L, Tamaoka J, Kato C, Horikoshi K and Bull AT 
(1998a) Taxonomy and biotransformation activities of some 
deep-sea actinomycetes . Extremophiles 2: 269-277; Colquhoun 
JA, Mexson J, Goodfellow M, Ward AC, Horikoshi K and Bull 
AT (1998b) Novel rhodococci and other mycolate 
actinomycetes from the deep sea. Antonie van Leeuwenhoek 

74 : 27-40) . 

Nachteilig an diesen Methoden ist, dass mit diesen 
Screening-Verfahren hauptsachlich Mikroorganismen der 
Gattungen Rhodococcus, Bacillus, Pseudomonas, o. a. 
gefunden wurden und die Diversitat der entsprechenden 
Nitrilhydratasen bezuglich Aktivitat oder 

Substratspezifitat damit auch eingeschrankt ist (Bunch A. 
W. (1998), Nitriles, in: Biotechnology, Volume 8a, 
Biotransformations I, Chapter 6, Eds.: Rehm H.J., Reed G. , 
Wiley-VCH, p. 277-324; Cowan D, Cramp R, Pereira R, Graham 
D, Almathawa Q (1998) Biochemistry and biotechnology of 
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mesophilic and thermophilic nitrile metabolising enzymes. 
Extremophiles 2: 207-216; Yamada H, Kobayashi M (1996) 
Nitrile hydratase and its application to industrial 
production of acrylamide. Biosci Biotechnol Biochem 60: 
5 1391-141) . 

Derzeitige Schatzungen gehen davon aus, dass in der Regel 
nur 0,01 - 1% der Mikroorganismen eines Habitats 
kultivierbar sind und damit einem Screening nach der oben 
beschriebenen Methode zugefuhrt werden konnen (Amann RI, 
10 Ludwig W, Schleifer KH (1995) Phylogenetic identification 

and in situ detection of individual microbial cells without 
cultivation. Microbiol. Rev. 59: 143-169; Pace NR (1997) A 
molecular view of microbial diversity and the biosphere. 
Science 276: 734-740; Cowan DA (2000) Microbial genomes — 
15 the untapped resource. Trends Biotechnol. 18: 14-16). Die 
Bedeutung der "direkten Klonierung" von genomischer DNA 
moglichst aller Organismen einer Bodenprobe (das 
"Metagenom" ) und deren Zufuhrung in ein genetisches 
Screening in Form von Metagenom-Genbanken gewinnt daher fiir 
20 die Identifizierung neuer technischer Enzyme immer mehr an 
Bedeutung. Das genetische Screening nach Enzym-kodierenden 
Genen kann hierbei Sequenz-homolog auf Basis konservierter 
Sequenzmotive oder bei Vorliegen geeigneter Enzymtests / 
Indikatormedien auch Aktivitats-homolog erfolgen (Lorenz P, 
25 Kohler B, Wolf M, Eck J, Zinke H (2000) Expression Cloning 
of Metagenome DNA from Soil. Biotechnol. 2000, Book of 
Abstr . Vol 2 : 3 06) . 

Mittels eines PCR-basierten Screenings unter Verwendung 
degenerierter Primer konnten bereits Nitrilhydratasen aus 

30 metagenomischer DNA amplifiziert werden, wobei aber die 

Sequenzen naturgemaS sehr hohe Ahnlichkeiten (90 - 99%) zu 
bekannten Nitrilhydratasen aufwiesen (Precigou S, Goulas P, 
Duran R, (2001) Rapid and specific identification of 
nitrile hydratase encoding genes in soil samples by 

35 polymerase chain reaction, FEMS Microbiol. Letters 204: 
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155-161) . Eine fundi erte Beurteilung der in dieser 
Zi tiers telle verwendeten Primer ist nicht moglich, da die 
Autoren die Seguenz der degenerierten Primer und deren 
Degenerationgrad nicht of fen legen. Die hone Ahnlichkeit 
der Seguenzen zu der Nitrilhydratasen aus Rhodococcus 
rhodochrous Jl H lasst vermuten, dass auch die 
Substratspezifitat nicht deutlich anders ist als bei dem 

genannten Enzym. 

Es bestand daher immer noch ein Bedarf an Verfahren und 
Systemen welche es gestatten, weitere der ins Auge 
gefassten Enzyme in fur technische MaSstabe ausreichender 
Art und Weise zur Verfugung zu stellen. 

Aufgabe der vorliegenden Erfindung war deshalb die Angabe 
eines weiteren Verfahrens zur Herstellung von 
Nitrilhydratasen. Insbesondere sollte das Verfahren im 
Stande sein, Nitrilhydratasen zu identif izieren, die in so 
genannten nicht kultivierbaren Organismen vorkommen. Eine 
weitere Aufgabe der vorliegenden Erfindung bestand in der 
Herstellung von gegeniiber dem Stand der Technik 
verbesserten Nitrilhydratasen. 

Diese und weitere nicht naher spezif izierte, sich jedoch 
aus dem Stand der Technik in naheliegender Weise ergebende 
Aufgaben werden durch die Angabe spezieller 

Primerbestandteile gemaK Anspruch 1 und deren Anwendung in 
einem Verfahren mit den Merkmalen des Anspruchs 2 gelost. 
Anspruch 3 bis 5 beziehen sich aufbevorzugte 

Ausfuhrungsformen des gegenstandlichen Verfahrens. Anspruch 

6 schiitzt die erfindungsgemateen Proteinseguenzen, Anspruch 

7 ist auf die sie codierenden Nukleinsaureseguenzen 
gerichtet und Anspruch 8 betrifft die mit diesen 
Nukleinsaureseguenzen ausgestatteten Expressionssysteme . 
Anspruch 9 befasst sich mit erf indungsgemafc hergestellten 
neuen Nitrilhydratasen. Anspriiche 10 und 11 sind auf 
spezielle Verwendung gerichtet. 
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Voraussetzung fiir das Auffinden neuer Nitrilhydratasen 1st 
die Angabe von Nukleinsauresequenzen, die im Stande sind, 
als Sonde fiir Nitrilhydratase-Gene in DNA- 
Metagenombibleotheken zu dienen. Durch die Angabe von 
degenerierten Primerbestandteilen aus der Gruppe bestehend 

aus 



A- 


Olf : 


gcsmrsgcstgg 


(Seq. 


ID NO. 


1) 


B- 


Olf : 


ggsctsccscc 


(Seq. 


ID 


NO. 


2) 


B- 


Olr : 


ggsggsagscc 


(Seq. 


ID 


NO. 


3) 


c- 


Olr : 


ggncgcwbsgg 


(Seq. 


ID 


NO. 


4) 


A- 


•Olf : 


gcnmrrgcntgg 


(Seq. 


ID NO. 


5) 


B- 


■Olf : 


: ggnytnccncc 


(Seq. 


ID 


NO. 


6) 


B- 


-Olr : 


: ggnggnarncc 


(Seq. 


ID 


NO. 


7) 


c- 


-Olr 


: gwngwrtccca 


(Seq. 


ID 


NO. 


8) 


A- 


-Olf 


: gcntggrynga 


(Seq. 


ID 


NO. 


9) 


B- 


-Olf 


: ggnytsccncc 


(Seq. 


ID 


NO. 


10) 


B- 


-Olr 


: ggnggsarncc 


(Seq. 


ID 


NO. 


11) 


C- 


-Olr 


: swnswrtccca 


(Seq. 


ID 


NO. 


12) 



20 gelangt der Fachmann vollig iiberraschend daftir aber nicht ^ 
minder vorteilhaft zu besonderen Nukleinsauresequenzen, die 
nelfen, spezielle Sonden fur das Fischen nach 
Nitrilhydratase-Genen in DNA-Metagenombibliotheken zu 
erstellen. Es sind dies degenerierte Nukleinsauresequenzen, 
25 die auf der einen Seite spezifisch genug sind, nur 

Nitrilhydratase-Gene ausfindig zu machen, auf der andern 
Seite jedoch so unspezifisch sind, dass moglichst alle 
vorhandenen Nitrilhydratase-Gene erf ass t werden. Deren 
Herstellung war zur Zeit der Erfindung aus dem Stand der 
30 Technik in naheliegenderweise nicht herleitbar. 

Gegenstand der vorliegenden Erfindung war demnach auch ein 
verfahren zur Herstellung von Proteinsequenzen, welche 
notwendig zum Aufbau der Aktivitat einer Nitrilhydratase 

sind, dergestalt, dass man 
3 5 a) eine DNA-Metagenombibleothek eines Habitats erstellt, 

b) diese mit mindestens jeweils einem forward(f)- und einem 
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reverse (r) -Primer aufweisend eine degenerierte 
Nukleinsauresequenz gemaS den Seguenzen 1 bis 12 
kontaktiert, 

c) eine PCR hiermit durchfiihrt, 

d) aus den erhaltenen Teilsequenzen die Volllangensequenzen 
der Nukleinsauren codierend fur Proteinsequenzen notwendig 
zum Aufbau der Aktivitat einer Nitrilhydratase generiert 

und 

e) diese in einen Gastorganismus kloniert und exprimiert . 

Wie eingangs schon angemerkt, bestehen Nitrilhydratasen 
zumindest aus zwei verschiedenen Untereinheiten (a- und (3- 
Untereinheit) . Es kann jedoch sein, dass neben diesen zwei 
Untereinheiten weitere Proteinsequenzen notwendig sind, urn 
eine Aktivitat der Nitrilhydratasen zu gewahrleisten. Unter 
Umstanden ist das Vorhandensein bestimmter so genannter 
putativer „Aktivatoren« (z. B. Faltungsproteine etc.) 
notwendig, damit entsprechende Aktivitaten von 
Nitrilhydratasen zu Stande kommen. Die fur diese 
Aktivatoren codierenden Nukleinsauresequenzen befinden sich 
haufig in unmittelbarer Nahe der Nukleinsauresequenzen 
kodierend fur die entsprechenden Nitrilhydratase- 
Untereinheiten. Es ist demnach moglich, durch das Fischen 
nach Nukleinsauresequenzen kodierend fur Nitrilhydratasen 
alle die fur die Aktivitat der Nitrilhydratasen benotigten 
.Proteinsequenzen mi tzuerfassen. Laut erf indungsgemaKem 
Verfahren geht man von der Erst el lung einer DNA- 
Metagenombibliothek eines bestimmten Habitats aus. Wie 
diese Bibliothek erstellt wird, ist dem Fachmann gelaufig 
(Knietsch, AW, Tanja; BS; Henne, ADR (2003) Metagenomes of 
Complex Microbial 'Consortia Derived from Different Soils as 
Sources for Novel Genes Conferring Formation of Carbonyls 
from Short-Chain Polyols on Escherichia coli. Journal of 
Molecular Microbiology and Biotechnology 5(1): 46-56; 
Rondon, MR; August, PR; Bettermann AD; Brady, SF; Grossman, 
T H; Liles, MR; Loiacono, KA; Lynch, BA; MacNeil, IA; 
Mino,r C; Tiong, CL; Gilman, M; Osburne, MS; Clardy, J; 
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Handelsman, J; Goodman, RM (2000 ) Cloning the soil 
metagenome: a strategy for accessing the genetic and 
functional diversity of uncultured microorganisms. Applied 
and environmental microbiology 66 (6) : 2541-7 ) . Diese wird im 
f olgenden mit Primern versetzt, welche die erf indungsgemaS 
degenerierten Nukleinsauresequenzen (Seq. ID No. 1-12) 
aufweisen. AnschlieSend wird eine PC-Reaktion durchgefuhrt , 
wobei Teilsequenz en der Nukleinsauresequenzen kodierend fur 
Nitrilhydratase-Untereinheiten erhalten werden. Ausgehend 
von diesen Teilsequenzen kann der Fachmann mittels Methoden ' 
des Standes der Technik auf die entsprechenden 
Volllangensequenzen der entsprechenden 

Nukleinsauresequenzen schlieSen (Schloss, PD; Handelsman, 
J (2003 ) Biotechnological prospects f rom metagenomics . 
Current Opinion in Biotechnology, 14(3): 303-310; Rondon, 
MR; August, PR; Bettermann AD; Brady, SF; Grossman, T H; 
Liles, MR; Loiacono, KA; Lynch, BA; MacNeil, IA; Mino,r C; 
Tiong, CL; Gilman, M; Osburne, MS; Clardy, J; Handelsman, 
j ; Goodman, RM (2000 ) Cloning the soil metagenome: a 
strategy for accessing the genetic and functional diversity 
of uncultured microorganisms . Applied and environmental 
microbiology 66 (6) : 2541-7 ) . AbschlieEend werden die 
gefundenen Nukleinsauresequenzen in bestimmten 
Expressionssystemen rekombinant hergestellt. Dies ist dem 
Fachmann ebenfalls gelaufig (Lit. s.u.). 

in einer bevorzugten Ausf lihrungsf orm werden die 
erfindungsgemaSen degenerierten Nukleinsauresequenzen (Seq. 
ID No. 1-12) im vorliegenden Verfahren der Gestalt 
eingesetzt, dass man jeweils Primerpaare aus Primern 
aufweisend die Nukleinsauresequenzen A-Olf (Seq. ID No . 1, 
5, 9) und B-Olr (Seq. ID No. 3, 7, 11) oder C-Olr (Seq. ID 
No 4, 8, 12) sowie B-Olf (Seq. ID No. 2, 6, 10) und C-Olr 
(Seq. ID No. 4, 8, 12) bei der PGR einsetzt. Unter diesen 
Kombinationen werden die Nukleinsauresequenzen kodierend 
fur die Proteins equenzen, welche notwendig fur die 
Aktivitat von Nitrilhydratase sind, in bevorzugter und 
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effizienter Art und Weise detektiert . 

Weiterhin 1st bevorzugt, wenn den oben dargestellten 
degenerierten Priraerbestandteilen gewisse andere 
Nukleinsauresequenzen (z.B. „Stabilisierungbereiche» ) 
vorgeschaltet sind (Kwok S, Chang SY, Sninsky JJ, Wang A, 
1995, "Design and use of mismatched and degenerate primers" 
In: "PCR Primer, A laboratory Manual" Dieffenbach CW & 
Dveksler GS (Editors), Cold Spring Habor Laboratory Press, 
p P 143-155; Compton T, 1990, "Degenerate Primers for DNA 
Amplification" In: "PCR Protocols, A Guide to Methods and 
Applications", innis MA, Gelfand DH, Sninsky JJ, White TJ 
(Editors) Academic Press, San Diego, pp39-45) . In diesem 
Fall bestehen die bei der PC-Reaktion eingesetzten Primer 
aus degenerierten Nukleinsauresequenzen der oben 
dargestellten Art (Sequenzen ID No . 1 bis 12) und den in 
den Sequenzen mit den ID No. 13 bis 23 erwahnten 
Nukleinsauresequenzen. Ganz besonders bevorzugt ist daher 
ein Verfahren, bei dem den degenerierten 

Nukleinsauresequenzen (Seq. ID No. 1-12) solche ausgewahlt 

aus der Gruppe bestehend aus: 

GCCAAGGTCGTC (Seq. ID NO . 13) 

GGCCGGTCCTG (Seq. ID NO. 14) 

TCCTTGTACCAGGTC (Seq. ID NO . 15) 

GCCCGCC (Seq. ID NO . 16) 

GGCGCTAATGTTGTT (Seq. ID NO. 17) 

TGGCCGGTTCTG (Seq. ID NO . 18) 

CAAATTCTTTATACCAAGTC (Seq. ID NO . 19) 

CCATATATCGCATTTCAGCT (Seq. ID NO . 20) 

GGTCGTGGCCAAG (Seq. ID NO . 21) 

GGCCGGTCCTG (Seq. ID NO . 22) 

TCCTTGTACCAGGTC (Seq. ID NO . 23) 

GCGCATTTCGGCG (Seq. ID NO . 234) 

vorangestellt sind. Diese Sequenzen sind ebenfalls aus 
konservierten Regionen von Nitrilhydratasen abgeleitet und 
der Kodon-Verwendung von Organismen mit unterschiedlichem 
GC-Gehalt angepasst. 
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(Seq. 


ID 


NO. 


25 ) 


(Seq. 


ID 


NO . 


26) 


(Seq. 


ID 


NO. 


27) 


(Seq. 


ID 


NO. 


28) 


(Seq. 


ID 


NO. 


29) 


(Seq. 


ID 


NO. 


30) 


(Seq. 


ID 


NO. 


31) 


(Seq. 


ID 


NO. 


32) 


(Seq. 


ID 


NO. 


33) 


(Seq. 


ID 


NO. 


34) 


(Seq. 


ID 


NO. 


35) 


(Seq. 


ID 


NO. 


36) . 



Ganz besonders vorteilhaft 1st daher ein wie eingangs 
dargestelltes Verfahren, bei dem Primer eingesetzt werden, 
die ausgewablt sind aus der Gruppe bestehend aus 

GC fAAflGTCGTC qcsmrsgcstgg 
GGC CGGTCCT Gggs ctsccscc 
TCCTTGTACCAGGTC ggsggsagscc 

reccCGCC gcmcgcwbsgg 
rearqcTAAAGTTGTT qcnmrrgcntgg 

T nr^CGGTTCT Gqcrny t nc cnc c 
CAAATTCTTTATACCAAGTCg_gnggnarncc 

CCATATATCGCATTTCAGCTgwngwrtccca 

GGTCGTGGCCAAGgcntggrynga 

GGCCGGTCCTGggnytsccricc 

TCCTTGT A C C AOGTC qqnqqs ar nc c 
reran ATTTCGGC Gswnswrtccca 

Mit Hilfe dieser Primer koimten in DNA- 

Metagenombibleotheken NukleinsSureseguenzen kodierend fur 
Nitrilnydratasen sowie weitere Gene fur putative 
„Aktivatoren w nachgewiesen werden. 

DemgemaS bildet einen nachsten Gegenstand der vorliegenden 
Erfindung die Proteins equenzen, welche notwendig zum Aufbau 
der Aktivitat einer Nitrilhydratase sind, wobei diese 
weniger als 100% Homologie, bevorzugt weniger als 97%, 
weiter bevorzugt weniger als 96%, noch weiter bevorzugt 
weniger als 95%, mehr bevorzugt weniger als 90%,- ganz 
bevorzugt weniger als 85% und auSerst bevorzugt weniger als 
80% Homologie, auf Aminosaureebene zu derartigen bekannten 
Proteinsequenzen besitzen und wobei die sie codierenden 
Nukleinsauresequenzen aus Teilsequenzen generiert werden, 
die unter stringenten Bedingungen mit den erf indungsgemafien 
primern aufweisend die Nukleinsauresequenzen mit den 
Sequenz ID No . 1 bis 12 ein positives Hybridisierungssignal 

geben . 

Die positive Hybridisierung ist Voraussetzung dafur, dass 
entsprecbende Nukleinsauresequenzen mittels des PC-Reaktion 
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basierten Screenings gefunden werden konnen. Aus diesem 
Nukleinsauresequenzen konnen dann nach Verfahren, die dem 
Fachmann gelaufig sind, die entsprechenden rekombinanten 
Proteins equenzen erhalten werden. 

Durch sol che rekombinante Techniken gelangt man zu 
Organismen, welche in der Lage sind, die betrachtete 
Proteins equenz in fur einen technischen ProzeS 
ausreichender Menge zur Verfiigung zu stellen. Die 
Herstellung der erf indungsgemafcen rec-Proteinsequenzen 
erfolgt nach dem Fachmann bekannten gentechnologischen 
Verfahren (Sambrook, J.; Fritsch, E. F. und Maniatis, T. 
(1989), Molecular cloning: a laboratory manual , 2 nd ed. , 
Cold Spring Harbor Laboratory Press, New York; Balbas , P. 
und Bolivar, F. (1990), Design and construction of 
expression plasmid vectors in E.coli, Methods Enzymol . 185, ■ 
14-37; Rodriguez, R.L. und Denhardt, D. T (eds) (1988), 
Vectors : a survey of molecular cloning vectors and their 
uses, 205-225, Butterworth, Stoneham) . Bezuglich der 
allgemeinen Vorgehensweise (PCR, Klonierung, Expression 
etc.) sei auch auf folgende Literatur und das dort zitierte 
verwiesen: Universal GenomeWalker™ Kit User Manual, 
Clontech, 3/2000 und dort zitierte Literatur; Triglia T . ; 
Peterson, M. G. und Kemp, D.J. (1988), A procedure for in 
vitro amplification of DNA segments that lie outside the 
boundaries of known sequences, Nucleic Acids Res. 16, 8186; 
Sambrook, J.; Fritsch, E. P. und Maniatis , T . (1989), 
Molecular cloning: a laboratory manual, 2 nd ed. , Cold 
Spring Harbor Laboratory Press, New York; Rodriguez, R.L. 
und Denhardt, D. T (eds) (1988), Vectors: a survey of 
molecular cloning vectors and their uses, Butterworth, 
Stoneham. 

Einen nachsten Gegenstand der vorliegenden Erfindung bilden 
auch die entsprechenden Nukleinsauresequenzen, welche fur 
die eben gezeigten Proteins equenz en kodieren. Es sind dies 
mi thin alle, die im Umfang der Degeneration des genetischen 
Codes fur die gleiche Proteinsequenz kodieren. Ebenfalls 
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umfasst sind damit auch solche, welche eine Homologie auf 
Nukleinsaureebene zu den erf indungsgemaS gefundenen 
Nukleinsauresequenzen von mindestens 7 0 Prozent besitzen 
Oder entsprechende Fragmente dieser Nukleinsauresequenzen, 
die wiederum fur Proteinsequenzen codieren, die am Aufbau 
der Aktivitat einer Nitrilhydratase beteiligt sind. 
Bevorzugt kodieren diese fur Proteinsequenzen, die 
gegenilber den erf indungsgemaS gefundenen Proteinsequenzen 
verbessert sind. 

Erfindungsgemafie Nukleinsauresequenzen sind z. B. die der 
ungeraden Seq. ID No. 37 bis 85. Es ist mit den . gefundenen 
Nukleinsauresequenzen - wie oben dargestellt - moglich, die 
erfindungsgemaSen Proteinsequenzen aus schnell wachsenden 
Wirtsorganismen, z.B. E. coli, in hohen Ausbeuten zu 
gewinnen . 

Dies geschieht durch Einbau (Klonierung) der 
erfindungsgemaSen Nukleinsauresequenzen in spezielle 
Expressionssysteme, mit deren Hilfe die entsprechenden 
Proteinsequenzen aus bevorzugten wirtsorganismen in 
rekombinanter Art und Weise gewonnen werden konnen. Einen 
nachsten Aspekt der vorliegenden Erfindung bildet deshalb ■ 
ein (kilns tlich hergestelltes) Expressionssystem. aufweisend 
eine oder mehrere der erf indungsgema£en 
Nukleinsauresequenzen. Als Expressionssystem kommen 
prinzipiell alle dem Fachmann fur diesen Zweck geiaufigen 
• systeme in Frage. Vorzugsweise sind dies Plasmide oder 
Vektoren und Mikroorganismen. 

Als Plasmide oder Vektoren kommen im Prinzip alle dem 
Fachmann fur diesen Zweck zur Verfugung stehenden 
Ausfiibrungsformen in Frage. Derartige Plasmide und Vektoren 
konnen z. B. von Studier und Mitarbeiter (Studier, W. F . ; 
Rosenberg A. H.; Dunn J. J.; Dubendroff J. W. ; (1990), Use 
of the T7 RNA polymerase to direct expression of cloned 
genes, Methods Enzymol. 185, 61-89) oder den Broschuren der 
Firmen Novagen, Promega, New England Biolabs, Clontech oder 
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Gibco BRL entnommen werden. Weiter bevorzugte Plasmide und 
Vektoren konnen gefunden werden in: Glover, D. M. (1985), 
DNA cloning: a practical approach, Vol. I-III, IRL Press 
Ltd., Oxford; Rodriguez, R.L. und Denhardt, D. T (eds) 
(1988), Vectors: a survey of molecular cloning vectors and 
their uses, 17 9-2 04, Butterworth, Stoneham; Goeddel, D. V. , 
(1990) , Systems for heterologous gene expression, Methods 
Enzymol. 185, 3-7; Sambrook, J.; Fritsch, E. F. und 
Maniatis, T . (1989), Molecular cloning: a laboratory 
manual, 2 nd ed. , Cold Spring Harbor Laboratory Press, New 
York. 

Plasmide, mit denen das die erf indungsgemaSe 
Nukleinsauresequenzen aufweisende Konstrukt in ganz 
bevorzugter Weise in den Wirtsorganismus kloniert werden 
kann, sind: P UC18 (Roche Biochemicals ) , pKK-177-3H (Roche 
Biochemicals) , pBTac2 (Roche Biochemicals) , pKK223-3 
(Amersham Pharmacia Biotech) , pKK-233-3 (Stratagene) oder 
pET (Novagen) . AuBerst bevorzugt sind Plasmide der pET- 
Reihe . 

Der rekombinante Mikroorganismus , in den die die 
erfindungsgemafien Nukleinsauresequenzen enthaltenen 
Plasmide bzw. Vektoren kloniert werden, dient wie gesagt 
zur Vermehrung und Gewinnung einer ausreichenden Menge der 
rekombinanten Proteinsequenz . Die Verfahren hierfur sind 
dem Fachmann wohlbekannt (Sambrook, J.; Fritsch, E. F. und 
Maniatis, T. (1989), Molecular cloning: a laboratory 
manual, 2 nd ed. , Cold Spring Harbor Laboratory Press, New 
York) . Als Mikroorganismen konnen im Prinzip alle dem 
Fachmann fur dies en Zweck in Frage kommenden Organismen wie 
z.B. Hefen wie Hansenula polymorpha, Pichia sp . , 
Saccharomyc&s cerevisiae, Prokaryonten, wie E. coli, 
Bacillus subtilis oder Eukaryonten, wie Saugerzellen, 
insektenzellen oder Pf lanzenzellen herangezogen werden. 
Vorzugsweise sind E. coli-S tamme fur dies en Zweck zu 
benutzen. Ganz besonders bevorzugt sind: E . coli XLl Blue, 
NM 522, JM101, JM109, JM105, RRl , DH50C, TOP 10" oder HB101, 
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BL21, BL21 codon plus RIL, BL21 (DE3 ) , Oder BL21 (DE3) 
codon plus RIL. 

Weiterhin eigenen sich die erf indungsgemaSen (geraden Seq. 
ID No. 37 bis 85) und dariiber hinaus weiter verbesserten 
Nukleinsauresequenzen, die fur den Aufbau der Aktivitat 
einer Nitrilhydratase notwendigen Proteinseguenzen 
codieren, bevorzugt zur Herstellung von sogenannten 
Ganzzellkatalysatoren. Derartige Ganzzellkatalysatoren sind 
prinzipiell rekombinante Mikroorganismen wie die eben 
angesprochenen . Diese weisen jedoch neben den klonierten 
Genen kodierend fur eine Nitrilhydratase auch weitere fur 
den Abbau von Nitrilen zu Sauren notwendigen Enzyme auf . 
Wie eingangs erlautert sind dies Enzyme, die eine Amidase- 
Aktivitat auf weisen. 

Als rekombinante Mikroorganismen der oben angesprochenen 
Art gelten deshalb auch Ganzzellkatalysatoren aufweisend 
mindestens ein kloniertes Gen fur eine Proteinsequenz mit 
(D- Oder L-)Amidaseaktivitat und klonierte Gene kodierend 
fur eine aktive Nitrilhydratase. Optional kann der 
Ganzzellkatalysator weitere Nukleinsauresequenzen 
aufweisen, die fur Enzyme kodieren, welche fur den Abbau 
einer Nitril-Funktion in eine Saure-Funktion vorteilhaft 
sind. Es sind dies vor all em Enzyme ausgewahlt aus der 
Gruppe der Proteinsequenzen mit a-Aminonitril- 
Racemaseaktivitat, mit Cyanhydrin-Racemaseaktivitat , mit 
a-Hydroxycartaonsaure-Racemaseaktivitat oder mit (a- bzw. 
B-) -Aminosaureamid-Racemaseaktivitat . 

per erfindungsgemafie Ganzzellkatalysator produziert neben 
den erfindungsgemaSen Proteinsequenzen, die zum Aufbau 
einer Nitrilhydratase-Aktivitat notwendig sind, 
vorzugsweise eine Proteinsequenz mit L-Amidaseaktivitat aus 
Rhizobium, vorzugsweise R. huautlense DSM 14983 

(WO2004/005517) oder mit D-Amidaseaktivitat , z. B. die aus 

Variovorax (EP 1318193) . 

Entsprechende Racemasen sind z.B. aus Pseudomonas putida 
und Rhodococcus sp. bekannt (Godtf redsen, S. E. ; Clausen, 
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K. ; ingvorsen, K. ; Hermes, H. P.; Van Balken, J. A.; 
Meijer, E. M. (1989, EP 0 307 023; WO 8 901 525). Weitere 
Aminosaureamid-Racemase bei Klebsiella oxytoca sind 
beschrieben bei Hermes und Mitarbeiter (Hermes, H. F. M. ; 
Peeters, W. P . ; Peters, P. J. (1990), EP 0 383 403), sowie 
in Agrobacterium rhizogenes und Ochrobacterium anthropi 
(Boesten, W. H. J.; Raemakers-Franken, P. C; Sonke, T. ; 
Euverink, G. J . W. ; WO 03106691). Der Vorteil des Einsatzes 
von entsprechenden Racemasen liegt in der Tatsache 
begrundet, dass ein racemisches Nitril zu 100% in die 
entsprechende enantiomerenangereicberte Saure umgewandelt 

werden kann. 

Vorzugsweise wird als Ganzzellkatalysator ein Organismus 
wie in der DE10155928 genannt als Wirtsorganismus 
eingesetzt. Der Vorteil eines derartigen Organismus ist die 
gleichzeitige Expression mehrerer Enzymsysteme, womit nur 
noch ein rec-Organismus fur die Reaktion von einem leicht 
herstellbaren Nitril bzw. Cyanhydrin oder a-Aminonitril 
zur entsprechenden enantiomerenangereicberten Saure 
angezogen werden muS. 

Urn die Expression der ins Auge gefassten 
Nukleinsauresequenzen im Hinblick auf die 
Umsetzungsgeschwindigkeiten der durcb sie codierten 
Proteinsequenzen (Enzyme) abzustimmen, konnen die 
entsprechenden Nukleinsauresequenzen auf unterschiedlichen 
Plasmiden mit unterschiedlichen Kopienzahlen untergebracht 
und/oder unterschiedlich starke Promotoren fur eine 
unterschiedlich starke Expression der Nukleinsauresequenzen 
■ verwendet werden. Bei derart abgestimmten Enzymsystemen 

tritt vorteilhafterweise eine Akkumulation einer ggf . 

inhibierend wirkenden Zwischenverbindung nicht auf und die 
betrachtete Reaktion kann in einer optimalen 

Gesamtgeschwindigkeit ablaufen. Dies ist dem Fachmann 

jedoch hinlanglich bekannt (Gellissen, G. ; Piontek, M. ; 

Dahlems, U. ; Jenzelewski, V.; Gavagan, J. W. ; DiCosimo, R. ; 

Anton, D. L. ; Janowicz, Z. A. (1996), Recombinant Hansenula 

polymorpha as a biocatalyst. Coexpression of the spinach 
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glycolate oxidase (GO) and the S. cerevisiae catalase T 
(CTT1) gene, Appl . Microbiol. Biotechnol . 46, 46-54; 
Farwick, M. ; London, M. ; Dohmen, J.; Dahlems, U. ; 
Gellissen, G. ; Strasser, A. W. ; DE19920712). 

Mit dem vorliegenden Verfahren ist es demnach moglich, die 
a- und p-Untereinheiten von Nitrilhydratasen ausgehend von 
DNA-Metagenombibleotheken herzustellen. Demgemafc bildet 
einen weiteren Gegenstand der vorliegenden Erfindung die 
Nitrilhydratasen aufweisend die erf indungsgemaSen 
Proteinsequenzen fur a-Untereinheiten und p-Untereinheiten 
von Nitrilhydratase, welche sich aus den durch dieses 
Verfahren zuganglichen Nukleinsauresequenzen kodierend fur 
die erfindungsgemaSen a- und (3-Untereinheiten herstellen^ 
lassen. Wie in den Beispielen gezeigt, ergeben sich dabei 
auch aktiven Nitrilhydratasen, wenn beliebige a- 
Untereinheiten mit beliebigen p-Untereinheiten kombiniert 
warden. Dadurch ist es moglich, die Diversif iziertheit von 
moglichen Nitrilhydratasen weiter zu steigern. 

Weitere Gegenstande der vorliegenden Erfindung beziehen 
sich auf die Verwendung der durch das erf indungsgemaSe 
Verfahren hergestellten Nukleinsauresequenzen zur Erzeugung 
von verbesserten Proteinsequenzen notwendig zum Aufbau der 
Aktivitat einer Nitrilhydratase. Wie der Fachmann bei der 
Verbesserung von Proteinsequenzen auf Basis der Anderung 
von Nukleinsauresequenz vorgeht, ist allgemein bekannt . 
Dies geschieht im allgemeinen durch Anwendung von 
Mutagenese-Methoden. Als Mutagenese-Methoden kommen alle 
dem Fachmann fur diesen Zweck zur Verfugung stehenden 
Methoden in Frage. Insbesondere sind dies die 
Sattigungsmutagenese, die Random-Mu t agenesis , in vitro- 
Rekombinations-Methoden sowie site-Directed-Mutagenesis 
(Eigen, M. und Gardiner, W. (1984), Evolutionary molecular 
engineering based on RNA replication, Pure Appl. Chem. 56, 
967-978; Chen, K. und Arnold, F. (1991), Enzyme engineering 
for nonaqueous solvents: random mutagenesis to enhance 
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activity of subtilisin E in polar organic media. 
Bio/Technology 9, 1073-1077; Horwitz, M. und Doeb, L. 
(1986), Promoters Selected From Random DNA- Sequences , Proc . 
Natl Acad Sci USA 83, 7405-7409; Dube, D. und L. Loeb 
(1989), Mutants Generated By The Insertion Of Random 
Oligonucleotides Into The Active-Site Of The Beta-Lactamase 
Gene, Biochemistry 28, 5703-5707; Stemmer, P.C. (1994), 
Rapid evolution of a protein in vitro by DNA shuffling, 
Nature 370, 389-391 und Stemmer, P.C. (1994), DNA shuffling 
by random fragmentation and reassembly: In vitro 
recombination for molecular evolution. Proc Natl Acad Sci 
USA 91, 10747-10751) . 

Die so erhaltenen neuen Nukleinsauresequenzen werden nach 
den oben angegebenen Methoden in einen Wirtsorgansmus 
kloniert, exprimiert und die so hergestellten 
Proteins equenzen mit geeigneten Screening-Methoden 
detektiert und anschlieSend isoliert. Zur Detektion sind 
grundlegend alle moglichen Nachweisreaktionen fur die 
gebildeten Molekiile geeignet. Nitrilhydratase-aktivitaten 
konnen in einem gekoppelten enzymatischen Test mit Amidasen 
nachgewiesen werden, wobei Ammonium als Nebenprodukt 
gebildet wird. Fur deren Nachweis eignen sich grundlegend 
alle moglichen Nachweisreaktionen fur Ammoniak bzw. 
Ammoniumionen wie Nessler-Reagenz (Vogel, A., I., (1989) 
Vogel's textbook of quantitative chemical analysis, John 
Wiley & Sons, Inc., 5 th ed. , 679-698, New York), die 
Indophenolreaktion auch Berthelot 'sche Reaktion genannt 
(Wagner, R. , (1969) Neue Aspekte zur . Stickstof f analytik in 
der Wasserchemie, Vom Wasser, VCH-Verlag, Bd. 36, 263-318, 
Weinheim) insbesondere die enzymatische Bestimmung mittels 
der Glutamat-Dehydrogenase (Bergmeyer, H.,U., und Beutler, 
H.-O. (1985) Ammonia, in: Methods of Enzymatic Analysis, 
VCH-Verlag, 3 rd Edition, Vol. 8: 454-461, Weinheim) aber 
auch der Nachweis mit Ammonium- sens it iven Elektroden. 
Weiterhin dienen HPLC-Methoden zum Nachweis von Aminosauren 
wie z.B. ein Derivativ-Verf ahren auf der Basis von o- 
Pthaldialdehyd und N-lsobutyryl-Cystein zur 
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Enantiomerentrennung von Amino saur en (Bruckner, H. , Wittner 
R., iond Godel H. , (1991) Fully automated high-performance 
liquid chromatographic separation of DL-amino acids 
derivatized with o-Phthaldi aldehyde together with N- 
5 isopropyl- cysteine. Application to food samples, Anal. 
Biochem. 144, 204-206). Das direkt durch die 
Nitrilhydratasereaktion gebildete Amid kann ebenfalls iiber 
HPLC-Methoden (z. B. inverse_Phase) nachgewiesen werden. 

in einer letzten Ausgestaltung der vorliegenden Erfindung 
10 bezieht sich diese auf die Verwendung der erf indungsgemaSen 
Nitrilhydratasen zur Herstellung von organischen 
Saureamiden und Sauren, insbesondere 
enantiomerenangereicherten a-Hydroxysauren bzw. a- 

Aminosauren . 

15 Fur die Anwendung kann die ins Auge gefasste 

Nitrilhydratase in freier Form als homogen auf gereinigte 
Verbindungen oder als rekombinant hergestelltes Enzym 
verwendet werden. Weiterhin kann das Enzym auch als 
Bestandteil eines intakten Gastorganismus eingesetzt werden 
20 oder in Verbindung mit der auf geschlossenen und beliebig 
hoch aufgereinigten Zellmasse des Wirtsorganismus 1 
M6glich ist ebenfalls die Verwendung des Enzyms in 
immobilisierter Form (Sharma B. P.; Bailey L. F. und 
Messing R. A. (1982), Immobilisierte Biomaterialiern - 
25 Techniken und Anwendungen, Angew. Chem. 94, 836-852). 
Vorteilhafterweise erfolgt die Immobilisierung durch 
Lyophilisation (Paradkar, V. M. ; Dordick, J. S. (1994), 
Aqueous-Like Activity of a-Chymotrypsin Dissolved in 
Nearly Anhydrous Organic Solvents, J. Am. Chem. Soc. 116, 
30 5009-5010; Mori, T . ; Okahata, Y. (1997), A variety of lipi- 
coated glycoside hydrolases as effective glycosyl transfer 
catalysts in homogeneous organic solvents, Tetrahedron 
Lett. 38, 1971-1974; Otamiri, M. ; Adlercreutz, P.; 
Matthiasson, B. (1992), Complex formation between 
35 chymotrypsin and ethyl cellulose as a means to solbilize 

the enzyme in active form in toluene, Biocatalysis 6, 291- 
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3 05) . Ganz besonders bevorzugt ist die Lyophilisation in 
Gegenwart von oberf lachenaktiven Substanzen, wie Aerosol OT 
oder Polyvinylpyrrolidon oder Polyethylenglycol (PEG) oder 
Brij 52 (Diethylenglycol-mono-cetylether) (Kamiya, N. ; 
Okazaki, S.-Y.; Goto, M. (1997), Surfactant-horseradish 
peroxidase complex catalytically active in anhydrous 
benzene, Biotechnol . Tech. 11, 375-378). 

AuSerst bevorzugt ist die Immobilisierung an Eupergit® , 
insbesondere Eupergit C® und Eupergit 250L® (Rohm) 
(Eupergit.RTM. C, a carrier for immobilization of enzymes 
of industrial potential. Katchalski-Katzir , E. ; Kraemer, D. 
M. Journal of Molecular Catalysis B: Enzymatic (2000) , 
10(1-3), 157-176). 

Gleichfalls bevorzugt ist die Immobilisierung an Ni-NTA in 
Kombination mit dem His-Tag (Hexa-Histidin) erganzten 
Polypeptid (Purification of proteins using polyhistidine 
affinity tags. Bornhorst, Joshua A.; Falke, Joseph J. 
Methods in Enzymology (2000), 326, 245-254). 
Die Verwendung als CLECs ist ebenfalls denkbar (St. Clair, 
N.; Wang, Y.-F.; Margolin, A. L. (2000), Cof actor-bound 
cross-linked enzyme crystals (CLEC) of alcohol 
dehydrogenase, Angew. Chem. Int. Ed. 39, 380-383). 
Durch diese MaSnahmen kann es gelingen aus Polypeptides 
welche durch organische Solventien instabil werden, solche 
zu generieren, die in Gemischen von wSssrigen und 
organischen Losungsmitteln bzw. ganz in Organik arbeiten 

kSnnen . 

Die vorliegende Erfindung beschreibt die Gewinnung von 
Nitrilhydratasen und der en korrespondierende Gene durch die 
Erschliefcung der nicht-kultivierten mikrobiellen Diversitat 
verschiedener Habitate mittels molekulargenetischer 
Methoden. Durch Verwendung degenerierter Primer werden beim 
PCR-basierten Durchmustern von DNA-Metagenombibliotheken 
Nitrilhydratase-Gene identif iziert und die Teilseguenz der 
so erhaltenen PCR-Produkte auf geklart . in einem 
Folgeschritt wird die vollstandige DNA-Sequenz der Gene 
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bestimmt, urn nach Klonierung und heterologer Expression 
Enzymproben fur Aktivitatsprof ilierungen und 
towendungsuntersuchungen bereitzus tellen . 

Durch die rationale Auswahl von Bodenproben, die Nitrile 
en thai ten konnten, fur die Erst el lung von Metagenom-Banken 
(DNA-Metagenombibliotheken) und die Fokussierung auf 
anwendungsrelevante Substrate im Rahmen von 
Anreicherungskulturen, kann eine Anreicherung von Nitril- 
umsetzenden Mikroorganismen erzielt werden. in jedem Falle 
liefert das genetische Screening in Metagenom-Banken ein 
Pool an entsprechenden Nitrilhydratase-Genen zur 
nachfolgenden Expression, der aber auch als Grundlage fur 
eine Enzymoptimierung durch gerichtete Evolution dienen 

kann. 

Zur Identifizierung neuer Nitrilhydratasen wurden 
Metagenombibliotheken aus fiinf unterschiedlichen Habitaten 
und Standorten (Grasland, Wald, sandiges Okosystemen, 
Biofilm) mit mehr als 83.000 Klonen durchmustert . Der 
Aufbau solcher Metagenombibliotheken ist dem Fachmann 
gelaufig (Schloss, PD; Handelsman, J (2003) 
Biotechnological prospects from metagenomics . Current 
Opinion in Biotechnology, 14(3): 303-310; Knietsch, AW, 
Tanja; BS; Henne, ADR (2 003) Metagenomes of Complex 
Microbial Consortia Derived from Different Soils as Sources 
for Novel Genes Conferring Formation of Carbonyls from 
Short-Chain Polyols on Escherichia coli . Journal of 
Molecular Microbiology and Biotechnology 5(1) : 46-56; 
Rondon, MR; August, PR; Bettermann AD; Brady, SF; Grossman, 
T H; Liles, MR; Loiacono, KA; Lynch, BA; MacNeil, IA; 
Mino,r C; Tiong, CL; Oilman, M; Osburne, MS; Clardy, J; 
Handelsman, J; Goodman, RM (2000 ) Cloning the soil 
metagenome: a strategy for accessing the genetic and 
functional diversity of uncultured microorganisms. Applied 
and environmental microbiology 666): 2541-7). Diese Klone 
enthalten zusammen etwa 3 000 MBp DNA. Die DNA- 
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Metagenombibliotheken warden mit Hilfe von degenerierten 
Oligonukleotiden, abgeleitet von konservierten 
Primarstrukturmotiven bekannter Nitrilhydratasen, mittels 
eines PCR- Screenings nach neuen Nitrilhydratasen 
durchsucht. Als degenerierte Primer wurden solche gemaS den 
Sequenz ID No . 25 bis 3 6 benutzt. 

Dabei konnen insbesondere jeweils die Primer mit dem 
Primerbestandteil A-Olf mit den mit dem Primerbestandteilen 
B-Olr (GroSe des zu erwartenden PCR-produkts ca. 210 Bp) 
Oder C-Olr (GroSe des zu erwartenden PCR-produkts ca. 350 
Bp) und die primer mit dem Primerbestandteile B-Olf mit dem 
mit dem Primerbestandteil C-Olr (Gr6£e des zu erwartenden 
PCR-produkts ca. 180 Bp) kombiniert werden. Insbesondere 
der degenerierte „Kern»-Teil der Primer (unterstrichen in 
Seguenz ID No. 25 bis 36) ist fur das Identif izieren neuer 
Nitrilhydratasen von Bedeutung, wahrend der nicht 
degenerierte Abschnitt variiert werden kann. 

Die entsprechende PC-Reaktion kann nach bekannten Methoden 
durchgefiihrt werden. Bei der Verwendung besonderer 
Polymerasen ist die PCR nach Ma&gabe der Herstellerangaben 

abzuandern . 

in alien 5 Metagenombibliotheken konnten Klone 
identifiziert werden, die die Gene fur Nitrilhydratasen 
tragen. Dem Fachmann sind Methoden bekannt, urn mit der 
Teilseguenz der Nitrilhydratase-Gene den das Gen tragenden 
Klon zu identifizieren und die Volllangensequenz 
aufzuklaren (Schloss, PD; Handelsman, J (2003) 
Biotechnological prospects f rom metagenomics . Current 
Opinion in Biotechnology, 14(3): 303-310; Duran, R; 
Nishiyama, M; Horinouchi, S; Beppy, T (1993) 
Characterization of nitrile hydratase genes cloned by DNA 
screeningfrom Rhodococcus erythropolis . Biosci Biotech 
Biochem 57 (8) : 1323-1328). 
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So konnte die Volllangensequenzen (Nukleinsaureseguenzen) 
fiir insgesamt 12 Gene von a-Untereinheiten sowie fur 10 
Gene von (3-Untereinheiten bestimmt werden (Abbildung 1) . 
Dariiber hinaus wurde die Sequenz von drei Genen bestimmt, 
die fiir putative „Aktivatoren" von Nitrilhydratasen 
kodieren konnten. 

Zur Darstellung der Nitrilhydratasen warden die Gene der 
a- und (3-Untereinheiten jeweils separat unter die Kontrolle 
des Promoters des Gens 10 des Phagen T7 gestellt. Dazu 
wurden die Vektoren pET22b bzw. pET2 6b (Novagen, CN 
Bioscience, Inc.) verwendet (Abb . 5 und 6). Die Anwendung . 
eines Zwei-Vektor-Expressionssytems erlaubte die 
Moglichkeit der einfachen Kombination der Nitrilhydratase- 
Untereinheiten verschiedener Enzyme. Entsprechende 
Konstrukte wurden im Stamm E. coli BL21 (DE3 ) CodonPlus RID 
(Novagen, CN Bioscience, Inc.) exprimiert. Die Zellen 
wurden bei 2 6°C unter Verwendung von DB-Medium inkubiert 
und bei Erreichen einer Zelldichte von O.D.580 = 1.0 mit 
0,5 mM IPTG induziert. Dem vereinzelt auftretenden Problem 
der proteinaggregation nach Uberexpression bei 37°C konnte 
durch Reduktion der Temperatur auf 26°C begegnet werden. 
Die Koexpression verschiedener Chaperone (Trigger-Faktor , 
GroED/GroES und Dnak/DnaJ/GrpE) zeigte bei 2 6°C keinen 
zusatzlichen Effekt, der iiber den durch die 
Temperaturreduktion erzielten hinausging. 

Die Ausbeuten hinsichtlich der Aktivitat gegen Benzonitril 
variierten erheblich (Abb. 2), wobei keine eindeutige 
Korrelation zwischen der dargestellten Proteinmenge und der 
erzeugten Aktivitat nachzuweisen war. So war die Ausbeute 
fiir den Klon mit der Nitrilhydratase M49bD9 (Seg. ID No. 
49/71) mit 3 0 U/g BTM relativ hoch, obwohl in der SDS-PAGE- 
Analyse keine Proteine fiir die Nitrilbydratase nachweisbar 
waren. Demgegeniiber steht der Klon M12K24 (Seg. ID No. 
39/63), fur den eine Aktivitat von etwa 2,5 U/g BTM 
bestimmt wurden, obwohl beide Untereinheiten relativ stark 
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uberexprimiert werden konnten und ein betrachtlicher Anteil 
in der loslichen Fraktion zu finden war. Die Hone der 
Aktivitat hangt also stark von dem jeweiligen Enzym ab. 

Fur vers chi edene Nitrilhydratasen wurden in unmittelbarer 
Nahe zu den Genen fiir die Untereinheiten des Enzyms ein 
weiterer, kleiner offener Leserahmen beschrieben, der fur 
eine Proteins equenz kodiert, die an der Aktivierung der 
Nitrilhydratase beteiligt zu sein scheint. Diese Proteine 
wurden als P12K (Seq. ID No. 81/83) bzw. P14K (Seq. ID NO. 
85) bezeichnet, da ihr Molekulkargewicht etwa 12 bzw. 14 
kDa betragt. Wahrend einige Nitrilhydratasen auch ohne 
diese Pl2K-Homologen aktiv dargestellt werden konnten, war 
die Anwesenheit dieser Proteine fur die aktive Expression 
anderer Nitrilhydratasen essentiell. Urn den EinfluS von 
Pl2K-Homologen, deren Gene auch in drei Metagenom-Klonen 
gefunden wurden, auf die Expression der entsprechenden 
Nitrilhydratasen aber auch auf Nitrilhydratasen von anderen 
Klonen zu untersuchen, wurden zwei dieser Gene in den 
Vektor pBBRlMCSS (Kovach et al . , 1995, Four new derivatives 
• of the broad host range cloning vector pBBRlMCS, carrying 
different antibiotic-resistance cassetes, Gene 16 6: 175- 
176) kloniert und hier unter die Kontrolle des lac- 
Promotors gestellt. Die entsprechenden Konstrukte wurden 
mit P BBR5-Pl2K-M49bD9 und P BBR5-Pl2K-M3aGlO bezeichnet 
(Abb. 6 und 7) . 

Die Expression der Nitrilhydratase -Gene M49bD9 (Seq. ID No. 
49/71) und M3aG10 (Seq. ID No . 57/79) in Gegenwart der 
entsprechenden Pl2K-Homologen (Seq. ID No. 83 - M49bD9; 
Seq. ID No. 85 - M3aGlO) erfolgte im Stamm E. coli BL21 
CodonPlus RIL bei 26°C. In beiden Fallen konnten die 
Untereinheiten der Nitrilhydratasen deutlich uberexprimiert 

werden . 

Die Aktivitat der Nitrilhydratasen des Klons M49bD9 (Seq. 
ID No. 49/71) wurde durch die Anwesenheit des P12K- 
Homologen (Seq. ID No. 83) etwa urn den Faktor 27 auf ca. 
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830 U/g BTM gesteigert (Tabelle 1) . Fur das Enzym des Klons 
M3aGlO (Seq. ID No. 57/79) konnte unter dies en Bedingungen 
zum erstenmal Aktivitat (ca. 23 U/g BTM) nachgewiesen 
werden. Diese Ergebnisse belegen, dass die Anwesenheit der 
Pl2K-Homologen (Seq. ID No. 85) fur die Erhohung der 
Aktivitatsausbeute entscheidend kann. 

Tabelle 1: Aktivitat von Nitrilhydratasen nach Koexpression 
mit Pl2K-Homologen (Seq. ID No . 83 und 85) 



Klon 



M49bD9 (a, (3) 



M3 aGl 0 



Ohne P12K 



3 0 U/g BTM 



0 U/g BTM 



Mit P12K 



82 6 U/g BTM 



23 U/g BTM 



Die Kombination von Untereinheiten aus verschiedenen 
Metagenom-Klonen erof fnet die MSglichkeit Nitrilhydratasen 
mit potentiell neuen Substratspezif itaten zu erzeugen. 
Durch die Koitibination von a-Untereinheiten mit 
verschiedenen (3-Untereinheiten wiirde eine groSe Diversitat 
an Kombinationen neuer Nitrilhydratasen moglich werden. Bis 
dato ist eine solche Kombination von Untereinheiten aus 
nicht zusammengehorigen Nitrilhydratasen in der Literatur 
nicht bekannt. 

Urn diese Moglichkeit zu evaluieren, warden die co- 
unter einhei ten der Klone M73dC9 und Ml5aA6 (Seq. ID No. 59 
und 45) , fur die keine ^-Untereinheiten gefunden werden 
konnten, mit der P -untereinheit des Klons M12K24 (Seq. ID 
No. 63) im Stamm B. colt BL21 codon plus RID exprimiert. 

Wahrend sich bei der Expression des Paars von a-M73dC9a/b- 
M12K24 (Seq. ID No. 59 und 63) beide Untereinheiten etwa 
gleich stark darstellen lieSen, scheint die a-Untereinhext 
des Klons Ml5aA6 (Seq. ID No. 45) besser exprimiert worden 
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zu sein als die p-Untereinheit des Klons M12K24 (Seq. ID 
No. 63) . 

Die Kombination der a-Untereinheit des Klons M73dC9 (Seq. 
ID No. 59) und der p-Untereinheit des Klons M12K24 (Seq. ID ' 
No. 63) fuhrte iiberraschenderweise zur Bildung einer 
aktiven Nitrilhydratase mit einer Aktivtiat von ca. 0,07 
U/g BTM (Abb. 3) . Dieses Ergebnis belegt, daS es 
prinzipiell moglich ist, durch Kombination von 
Nitrilhydratase-Untereinheiten verschiedener Klone aktive 
Enzyme darzustellen . Dieses war zum Zeitpunkt der Erfindung 
aus dem Stand der Technik als solches nicht herleitbar. 

Stringente Bedingungen: Der Ausdruck -unter stringenten 
Bedingungen" wird hierin wie bei Sambrook et al . (Sambrook, 
J.; Fritsch, E. F. und Maniatis, T . (1989), Molecular 
cloning: a laboratory manual, 2 na ed. , Cold Spring Harbor 
Laboratory Press, New York) beschrieben, verstanden. 
Bevorzugt liegt eine stringente Hybridisierung gemaS der 
vorliegenden Erfindung vor, wenn nach Waschen fur eine 
Stunde mit 1 x SSC (150 mM Natriumchlorid, 15 mM 
Natriumcitrat, pH 7 . 0) und 0 , 1 % SDS (Natriumdodecylsulf at) 
bei 50 °C, bevorzugt bei 55 °C, mehr bevorzugt bei 62 °C und 
am meisten bevorzugt bei 68 °C und mehr bevorzugt fur 1 
Stunde mit 0,2 x SSC und 0,1 % SDS bei 50 °C, bevorzugter 
bei 55 °C, mehr bevorzugt bei 62 °C und am meisten bevorzugt 
bei 68 °C noch ein positives Hybridisierungssignal 
beobachtet wird. 

Unter optisch angereicherten (enantiomerenangereicherten, 
enantiomer angereicherten) Verbindungen wird im Rahmen der 
Erfindung das Vorliegen einer optischen Antipode im Gemisch 
mit der anderen in >50 mol-% verstanden. 

Unter dem Begriff Nukleinsauresequenzen werden alle Arten 
von einzelstrangiger und dazu komplementarer oder 
doppelstrangiger DNA (z.B. genomische, cDNA) als auch RNA 
(z.B. mRNA) oder Gemische derselben subsumiert. 
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Verbesserte Nukleinsauresequenzen kodieren fur verbesserte 
proteinseguenzen. Verbesserte Proteinsequenzen sind solche, 
bei denen eine Verbesserung im Hinblick auf die Aktivitat 
und/oder Selektivitat und/oder Stabilitat gegenuber den 
Ursprungssequenzen zu verzeichnen ist. Erf indungsgemafc 
bedeutet dies , dass die Proteine aktiver und/oder 
selektiver bzw. weniger selektiv oder unter den verwendeten 
Reaktionsbedingungen stabiler sind. Wahrend die Aktivitat 
und die Stabilitat der Proteine fur die technische 
Anwendung naturgemaS moglichst hocb sein sollte, ist in 
Bezug auf die Selektivitat dann von einer Verbesserung die 
Rede, wenn entweder die Substratselektivitat abnimmt, die 
Enantioselektivitat der Proteine jedocb gesteigert ist. 
Dies gilt ebenfalls fur Proteine als Bestandteile von 
Nitrilhydratasen, sofern sie dem Enzym die entsprechenden 
verbesserten Eigenschaf ten verleihen helfen. 

Von den beanspruchten Proteinsequenzen und den 
Nukleinsauresequenzen werden erf indungsgemaS aucb solche 
Sequenzen umfafct, die eine Homologie (exclusive der 
natiirlichen Degeneration) groSer als 7 0% (in Bezug auf die 
Nukleinsauresequenz) bzw. 80% (in Bezug auf die 
Proteinsequenzen), bevorzugt grdfier als 90%, 91%, 92%, 93% 
Oder 94%, mehr bevorzugt grower als 95% oder 96% und 
besonders bevorzugt groEer als 97%, 98% oder 99% zu einer 
dieser Sequenzen aufweisen, sofern die Wirkungsweise bzw. 
Zweck einer solchen Sequenz erhalten bleibt. Der Ausdruck 
"Homologie" (oder Identitat) wie hierin verwendet, kann 
durch die Gleichung H (%) = tl - V/X] x 100 definiert 
werden, worin H Homologie bedeutet, X die Gesamtzahl an 
Nukleobasen/Aminosauren der Vergleichssequenz ist und V die 
Anzahl an unterschiedlichen Nukleobasen/Aminosauren der zu 
betrachtenden Sequenz bezogen auf die Vergleichssequenz ist. 
Auf jeden Fall sind mit dem Begriff Nukleinsauresequnezen, 
welche fur Polypeptide codieren, alle Sequenzen umfaEt, die 
nach MaSgabe der Degeneration des genetischen Codes moglich 
erscheinen. 
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Beschreibung der Abb il dung en: 

Abbildung 1: Homologie unter den mittels eines genetischen 
Screenings gefundenen a- und p-Untereinheiten von 
Nitrilhydratasen . 



Abbildung 2: Aktivitat verschiedener Metagenom- 
Nitrilhydratasen gegen Benzonitil nacb Expression in E. 
colt BL21 (DE3) codon plus RIL mit □ und ■ ohne 
Koexpression des Triggerf aktors (n.b.: nicht bestimmt) . 



Abbildung 3 : Aktivitat von Nitrilhydratasen bei Kombination 
von Untereinheiten aus verscbiedenen Metagenom-Klonen. 



Abbildung 4: Die Vektorkarte zeigen die generelle Anordnung 
der a- Untereinheiten im Plasmid pET22 am Beispiel des 
Klones M49bD9. 

Abbildung 5: Die Vektorkarte zeigen die generelle Anordnung 
der p- Untereinheiten im Plasmid pET2 6 am Beispiel des 
Klones M49bD9 . 



Abbildung 6: Die Vektorkarte zeigen die Anordnung des 
proteins P12K des Klones M49bD9 im Plasmid pBBR5 . 



Abbildung 7: Die Vektorkarte zeigen die Anordnung des 
Proteins P12K des Klones M3aGlO im Plasmid pBBR5 . 
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Experiment el ler Teil : 
Allgemeines PCR-Protokoll 



Kultivierung von Mikroorganismen 

Die Kultivierung der E. coli Zellen und deren Aufbewahrung 
erfolgte nach Sambrock et al . (Sambrook, J.; Fritsch, E. F 
und Maniatis, T. (1989), Molecular cloning: a laboratory 
manual, 2 nd ed. , Cold Spring Harbor Laboratory Press, New 
York) . 



PCR-Protokoll : 

Ein typisches PCR-Protokoll ist im folgenden dargestellt, 
wobei ein Anpassen des Protokolls bei Verwendung einer 
anderer Polymerase nach MaSgabe der Herstellerangaben 
erforderlich wird. 

25ul HotStarTaq-Mastermix, Qiagen 

(2,5 U Polymerase, 2 00 uM dNTPs , lx PCR- Puffer) 

25 pmol Primer 01 f 
25 pmol Primer Olr 
2 ul template-DNA (20 - 200 ng) 



ad 50 ul A. dest 
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Programm: 



initiale Denaturierung : lx 15 min 95 °C 



Zyklenprogramm : 



3 5x 



flmin 95°C 



1 min 55 -69°C 



ll min 72 °C 



Finale Elongation: 



lx 7 min 72°C 



Last Extension: 7min 72 °C 



Verdau mit Restriktionsenzymen 



Die zu schneidende DNA wird mit 5 U Restriktionsenzym und 
den zugehorigen Puffer versehen und wenn nicht anders 
erforderlich bei 37°C inkubiert. Der Verdau chromosomaler 
DNA erfolgt mit 10 U Enzym. Die Inkubationsdauer betragt 
1,5 - 2,5 Stunden. 



Behandlung mit alkalischer Phosphatase 

Urn zu verhindern, dass Vektoren, welche nur mit einer 
Restriktionsendonuklease geschnitten wurden, mit sich 
selbst religieren, wird mit Hilfe der alkalischen 
Phosphatase der am 5'-Ende iiberhSngende Phosphatrest 
entfernt. Nur durch Insertion eines DNA-Fragments kann 
wieder zirkulare DNA entstehen. 

Der mit einer Restriktionsendonuklease geschnittene Vektor 
wird 15 min bei 65°C inkubiert, urn die 

Restriktionsendonuklease abzustoppen. AnschlieSend wird der 
Dephosphorylierungspuf fer zugegeben und mit 1 U alkalischer 
Phosphatase aus Schrimps wird 10 min bei 37 °C inkubiert. 
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Das Enzym wird durch eine ans chl i eSende Gelelektrophorese 
von der Vektor-DNA abgetrennt . 



Behandlung mit T4-DNA-Ligase 

5 Fur die Ligation werden Vektor und Insert im Verhaltnis 1:3 
eingesetzt. Das Volumen wird moglichst gering gewahlt (7-20 
ul) Der Ansatz wird in Ligationspuf f er und in Anwesenheit 
von 1 U Ligase bei 16 °C iiber Nacht inkubiert. 



10 Transformation 

Zum Li gat ions ansatz werden 100 ul kompetente Zellen 
pipettiert und der Ansatz durch wiederholtes Aufziehen der 
Pipette gemischt. Nach 3 0 min Inkubation auf Eis wird ein 
Hitzeschockschritt bei 42 °C fur 45 sec durchgef iihrt und 
15 wieder 2 min auf Eis inkubiert. Es werden 120-900 ul SOC- 
Medium zugegeben und der Ansatz wird 45 min bei 37 °C unter 
Agitation inkubiert. Anschlie&end wird der Ansatz 
ausplattiert und bei 37 °C iiber Nacht inkubiert. 



20 Expression von Metagenom-Nitrilhydratasen 

Die Expression der Konstrukte mit T7-Promotoren erfolgte 
nach folgendem Protokoll : 

50 ml LEWoo-Medium mit 2 mM Fe-Citrat und jeweils 50 M-g/ml 
Kanamycin & Ampicillin wurde l%ig mit einer Ubernachtkul tur . 
25 angeimpft. Nach Erreichen einer OD 600 von ca. 0,5 wurde mit 
1 mM iptg - (isopropylthiogalactosid) die Expression der 
Nitrilhydratasen induziert. Die Ernte der Zellen erfolgte 
ca. 24 Stunden nach Induktion bei 2 6°C. 
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Aktivitatsnachweis mit Benzonitril als Substrat 

Die Biotransformation wurde im 10 ml MaSstab durchgefiihrt 
mit ca. 100 mg Biof euchtmasse (OD 6 oo = 5) im 
Kaliumphosphatpuffer (100 mM) pH7 , 0 . Die Inkubation 
erfolgte bei 3 0°C und die Subs tratkonzentrat ion betrug ca. 
5 mM Benzonitril. Die Probennahme erfolgte alle 5-10 min 
iiber einen Zeitraum von maximal 1 Stunde. Das Probenvolumen 
betrug 100 pi und die Reaktion wurde durch Zugabe von 10 [il 
50%ige Phosphorsaure gestoppt. 

Die Konzentrationen von Benzonitril und Benzamid wurden 
dann mittels HPLC bestimmt: 

Saule: RPl8-Saule Phenomenex Hypersil ODS 5fA (mit Vorsaule) 

Fliefimittel: 10 mM K2HP04 , (pH 2.3) 

FluSrate: 1 ml / min 

Wellenlange: 2 02 nm 

Injektionsvolumen: 2 0 ul 

Dauer HPLC Lauf : 12-15 min 

Die Berechnung der Aktivitat erfolgte uber die Kalkulation 
von einem ^mol Umsatz nach einer Minute, was einem U (Unit 
entspricht) . Spezifische Aktivitaten werden in U pro g BTM 
Oder mg Protein angegeben. 
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Patentanspriiche : 



10 



15 



20 




25 



30 



Degenerierte Primerbestandteile aus 
bestehend aus 



der Gruppe 



A- 


Olf : 


* 

gcsmrsgcstgg 


(Seq. 


IE 


) NO. 




B- 


Olf : 


ggsctsccscc 


(Seq. 


ID 


NO. 


A ) 


B- 


Olr : 


ggsggsagscc 


(Seq. 


ID 


NO. 


3 ) 


C- 


Olr : 


ggncgcwbsgg 


(Seq. 


ID 


NO. 


4) 


A- 


•Olf : 


gcnitirrgcntgg 


(Seq. 


ID NO. 


5) 


B- 


-Olf : 


: ggnytnccncc 


(Seq. 


ID 


NO. 


6) 


B- 


-Olr : 


: ggnggnarncc 


(Seq. 


ID 


NO. 


7) 


C- 


-Olr 


: gwngwrtccca 


(Seq. 


ID 


NO. 


8) 


A- 


-Olf 


: gcntggrynga 


(Seq. 


ID 


NO. 


9) 


B- 


-Olf 


: ggnytsccncc 


(Seq. 


ID 


NO. 


10) 


B- 


-Olr 


: ggnggsarncc 


(Seq. 


ID 


NO. 


11) 


C- 


-Olr 


: swnswrtccca 


(Seq. 


ID 


NO. 


12) . 
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Verfahren zur Herstellung von Proteinsequenzen 
notwendig zum Aufbau der Aktivitat einer 
Nitrilhydratase dergestalt, dass man 

a) eine DNA-Metagenombibleothek eines Habitats 

i 

erstellt , 

b) diese mit mindestens jeweils einem forward(f)- und 
einem reverse (r) -Primer aufweisend eine degenerierte 
Nukleinsauresequenz gemaS Anspruch 1 kontaktiert, 

c) eine PCR hiermit durchf iihrt , 

d) aus den erhaltenen Teilsequenzen die 
Volllangensequenzen der Nukleinsauren codierend fiir 
Proteinsequenzen notwendig zum Aufbau der Aktivitat 
einer Nitrilnydratase generiert und 

e) diese in einen Gastorganismus kloniert und 

exprimiert . 

Verfahren nach Anspruch 2, 
dadurch gekennzeichnet , dass 

man jeweils Primerpaare aus Primern aufweisend die 
Nukleinsauresequenzen A-Olf und B-Olr oder C-Olr sowxe 
B-Olf und C-Olr bei der PCR einsetzt. 
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4. Verfahren nach Anspruch 2 und/oder 3, 
dadurch gekennzeichnet , dass 

den degenerierten Nukl e ins aur es equenz en solche 
ausgewahlt aus der Gruppe bestehend aus : 



GCCAAGGTCGTC 


(Seq. 


ID 


NO . 


13) 


GGCCGGTCCTG 


(Seq. 


ID 


NO. 


14) 


TCCTTGTACCAGGTC 


(Seq. 


ID 


NO. 


15) 


GCCCGCC 


(Seq. 


ID 


NO. 


16) 


GGCGCTAATGTTGTT 


(Seq. 


ID 


NO. 


17) 


TGGCCGGTTCTG 


(Seq. 


ID 


NO. 


18) 


CAAATTCTTTATACCAAGTC 


(Seq. 


ID 


NO. 


19) 


CCATATATCGCATTTCAGCT 


(Seq. 


ID 


NO. 


20) 


GGTCGTGGCCAAG 


(Seq. 


ID 


NO. 


21) 


GGCCGGTCCTG 


(Seq. 


ID 


NO. 


^22) 


TCCTTGTACCAGGTC 


(Seq. 


ID 


NO. 


23) 


GCGCATTTCGGCG 


(Seq. 


ID 


NO. 


24) 



vor anges t el 1 1 s ind . 



Verfahren nach einem oder mehreren der vorhergehenden 

Anspruche 2 bis 4, 

dadurch gekennzeichnet, dass 



man Primer ausgewahlt aus der Gruppe bestehend 


aus 


arc a AGOTCGTCac smr s gc s t gg 


(Seq. 


ID 


NO. 


25) 


nnccGGTCCTGcrcrs c t s ccs cc 


(Seq. 


ID 


NO. 


26) 


rpppTTHT ACC AGGTCcrcrs ggs ags c c 


(Seq. 


ID 


NO. 


27) 


GCCCGCCqgncgcwbsgg 


(Seq. 


ID 


NO. 


28) 


aannrTAAAGTTGTTgcnmrrgcntgg 


(Seq. 


ID 


NO. 


29) 


TpnrrnGTTCTGacrnvtnccncc 


(Seq. 


ID 


NO. 


30) 


ph a Arprrprp^TATACCAAGTCq-crncTCTnarncc 


(Seq. 


ID 


NO. 


31) 


pp a m a rp atppp ATTTC AGCTgwngwr t c c c a 


(Seq. 


ID 


NO. 


32) 


pprpppTaanCAAGcrcntggrynga 


(Seq. 


ID 


NO. 


33) 


ppppppTPPTGaanvtsccncc 


(Seq. 


ID 


NO. 


34) 


rprrT"parT. A nnAGGTCQgnggsarncc 


(Seq. 


ID 


NO. 


35) 


pppp ArpTTPHGCGswnswrtccca 


(Seq. 


ID 


NO. 


36) 



einsetzt . 
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6. proteins equenzen notwendig zum Aufbau der Aktivitat 
einer Nitrilhydratase mit weniger als 100% Homologie 
auf Aminos aureebene zu derartigen bekannten 
Proteinsequenzen, wobei die sie codierenden 
Nukleinsauresequenzen aus Teilsequenzen generiert 
werden, die unter stringenten Bedingungen mit den 
Primern aufweisend die Nukleinsauresequenzen des 
Anspruchs 1 ein positives Hybridisierungssignal geben 

7. Nukleinsauresequenz codierend fiir eine Proteinsequenz 
nach Anspruch 6 . 

8. Expressionssystem aufweisend eine oder mehrere 
Nukleinsauresequenzen nach Anspruch 7 . 

9. Nitrilhydratase aufweisend Proteinsequenzen fur a- 
Untereinheiten und p-Untereinheiten nach Anspruch 6. 

10. Verwendung der Nukleinsauresequenzen nach Anspruch 7 
zur Erzeugung von verbesserten Proteinsequenzen 
notwendig zum Aufbau der Aktivitat einer 
Nitrilhydratase . 

11. Verwendung der Nitrilhydratasen nach Anspruch 9 zur 
Herstellung von organischen Saureamiden und Sauren. 
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Zusammenf assung : 

Die vorliegende Erfindung befasst sich mit der Herstellung 
neuer Nitrilhydratasen . Diese werden vorzugsweise aus nicht , 
kultivierbaren Organismen iiber eine PCR-basiertes Screening 
in DNA-Metagenombibliotheken mit speziellen degenerierten 

Primern ' erhalten. 



4 
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Rhodococcus rhodocrous J1 H-ty 




- Pseudomonas chlororaphis 
Rhodococcus erythropolis 
Rhodococcus sp AJ270 




Bacillus sp 
Rhodococcus sp 
Rhodococcus rhodochrom 



Mesorhizobium loti 




Pseudomonas putida 
Rhodococcus sp M8 




Pseudomonas chlororaphis B23 
Rhodococcus erythropolis 



Rhodococcus sp AJ270 



Rhodococcus sp 




Rhodococcus rhodochrous JV 
Mesorhizobium loti 




Pseudomonas putida 




Bacillus sp BR449 
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Abb. 3 
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Abb. 4 
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Abb. 5 
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Abb. 6 



Bsal 
EC057I, 



BsaBI, 
BglllA 



IL 



>Bpm) 
.Sfil 



PciK 
AfllHi 



Tati, 
BsrGlA 



Hindi. 
NccO 
PpulOl. x 
NsilA 

sphi;: : 



Kpnl/ 

Acc65l 



EcoRI 
Xmai 
Smal 

BamHI 
Spel 
Xbal 

an 

BstXl 
Sac I 
Ecl1 361 1 
Banll 




\ I 

5000 



- ^BBR5-P12K-M49bD9 



5142 bps 




,Accl 
. f Bst1107l 

,Bbel 
" /.Kasl 
£Narl 
&Sfol 



P12K-M*9bD9 



EcoNl / 
Nrul 

Xmnl / 
Bsgl 

HindW 



Mscl 




Earl / 
Pvul 



Eco47l!l 



BstBI : 

Age! 
Bpu10i 
NgoMVi 
Nael 



PshAI 



040067 AM 



43 



Abb. 7 
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SEQUENCE LISTING 

<110> Degussa AG 

<12 0> Neue Nitrilhydratasen 

<130> 040067 AM 

<160> 86 

<170> Patentln version 3.1 

<210> 1 

<211> 12 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 1 
gcsmrsgcst gg 

12 



<210> 2 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 2 
ggsctsccsc c 

11 



<210> 3 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 3 
ggsggsagsc c 

11 



<210> 4 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 



040067 AM 



<220> 

<221> mis cofeature 

<222> (4) . . (4) 

<223> a or g or c or t/u 



<220> 

< 2 2 1 > mi s c__f eature 

<222> (3) . . (3) 

<223> a or g or c or t/u 



<400> 4 
ggncgcwbsg g 



<210> 
<211> 
<212> 
<213> 



5 

12 
DNA 

Artificial 



<220> 

<223> Primer 
<220> 

<221> misc_f eatur e 

<222> (3) . . (3) 

<223> a or c 



<220> 

< 2 2 1 > mis c_f eature 

<222> (9) . . (9) 

<223> a or g or c or t/u 



<400> 5 
gcnmrrgcnt gg 
12 



<210> 6 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1 > mi s c_f eature 

<222> (3) . . (3) 

<223> a or g or c or t/u 



<220> 

< 2 2 1 > mi s c_f eature 
<222> (6) . . (6) 



040067 AM 



<223> a or g or c or t/u 



<220> 

<221> mi s c_f eatur e 

<222> (9) . • (9) 

<223> a or g or c or t/u 



<400> 6 
ggnytnccnc 

11 



<210> 7 

<211> 11 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 
<220> 

< 2 2 1 > mi s c_f e a tn re 

<222> (3).. (3) 

<223> a or g or c or t/u 



<220> 

<221> mi s c_f eatur e 

<222> (6) . . (6) 

<223> a or g or c or t/u 



<220> 

< 2 2 1 > mi s c_f eatur e 

<222> (9) . . (9) 

<223> a or g or c or t/u 



<400> 7 
ggnggnarnc 

11 



<210> 8 

<211> 11 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 
<220> 

< 2 2 1 > mi s c_f ea tur e 

<222> (3) . . (3) 

<223> a or g or c or t/u 



040067 AM 



<400> 8 
gwngwrtccc a 

11 



<210> 9 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1 > mi s c_f ea tur e 

<222> (3) . . (3) 

<223> a or g or c or t/u 



<220> 

<221> misc_f eature 

<222> (9) . . (9) 

<223> a or g or c or t/u 



<400> 9 
gcntggryng a 

11 



<210> 10 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

<2 2 1> mi s cofeature 

<222> (3) . . (3) 

<223> a or g or c or t/u 



<220> 

<2 2 1> mi s c_f eature 

<222> (9).. (9) 

<223> a or g or c or t/u 



<400> 10 
ggnytsccnc c 

11 



<210> 11 

<211> 11 

<212> DNA 

<213> Artificial 



040067 AM 



<220> 

<223> Primer 
<220> 

< 2 2 1 > misc_feature 

<222> (3).. (3) 

<223> a or g or c or t/u 



<220>' 

< 2 2 1 > mi s c_f eatur e 

<222> (9) . . (9) 

<223> a or g or c or t/u 



<400> 11 
ggnggsarnc c 

11 



<210> 12 

<211> 11 

<212> DNA 

<213> Artificial 

■»«. 

<220> 

<223> Primer 



<220> 

< 2 2 1 > mi s c„f ea tur e 

<222> (3) . . (3) 

<223> a or g or c or t/u 



<400> 12 
swnswrtccc a 

11 



<210> 13 

<211> 12 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 13 
gccaaggtcg tc 
12 



<210> 14 

<211> 11 

<212> . DNA 

<213> Artificial 



<220> 
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<223> Primer 

<400> 14 
ggccggtcct g 

11 



<210> 15 

<211> 15 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> ' 15 
tccttgtacc aggtc 

15 



<210> 16 

<211> 7 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 16 

gcccgcc 

7 

<210> 17 

<211> 15 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 17 
ggcgctaaag ttgtt 

15 



<210> 18 

<211> 12 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 18 
tggccggttc tg 
12 



040067 AM 



<210> 19 

<211> 20 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 19 

caaattcttt ataccaagtc 
20 



<210> 20 

<211> 20 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 20 

ccatatatcg catttcagct 
20 



<210> 21 

<211> 13 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 21 
ggtcgtggcc aag 

13 



<210> 22 

<211> 11 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 

<400> 22 
ggccggtcct g 

11 



<210> 23 

<211> 15 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
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<400> 23 
tccttgtacc aggtc 

15 



<210> 24 

<211> 13 

<212> DNA 

<213> Artificial 



<220> 

<223> Primer 

<400> 24 
gcgcatttcg gcg 

13 



<210> 


25 


<211> 


24 


<212> 


DNA 


<213> 


Artificial 


<220> 




<223> 


Primer 


<400> 


25 


gccaaggtcg tcgcsmrsgc 


24 




<210> 


26 


<211> 


22 


<212> 


DNA 


<213> 


Artificial 


<220> 




<223> 


Primer 



<400> 26 

ggccggtcct gggsctsccs cc 
22 



<210> 


27 


<211> 


26 


<212> 


DNA 


<213> 


Artificial 


<220> 




<223> 


Primer 


<400> 


27 


tccttgtacc aggtcggsgg 


26 





<210> 28 
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<211> 18 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1> mi s c_f eature 

<222> (10) . . (10) 

<223> a or c or g or t/u 



<400> 28 

gcccgccggn cgcwbsgg 
18 



<210> 29 

<211> 27 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1 > mis c_f ea t ur e 

<222> (18) . . (18) 

<223> a or c or g or t/u 



<220> 

< 2 2 1 > mi s c_f eature 

<222> (24) . . (24) 

<223> a or c or g or t/u 



<400> 29 

ggcgctaaag ttgttgcnmr rgcntgg 
27 



<210> 30 

<211> 22 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1"> mi s c_f ea tur e 

<222> (15) . . (15) 

<223> a or c or g or t/u 



<220> 
<221> 



mis cofeature 
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10 



<222> (18) . . (18) 

<223> a or c or g or t/u 



<220> 

< 2 2 1 > mi s c_f eature 

<222> (21) . . (21) 

<223> a or c or g or t/u 



<400> 30 

tggccggttc tgggnytncc nc 
22 



<210> 31 

<211> 31 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1 > mi s c_f eature 

<222> (23) . . (23) 

<223> a or c or g or t/u 



<220> 

< 2 2 1 > mi s c_f eature 

<222> (26) . . (26) 

<223> a or c or g or t/u 



<220> 

< 2 2 1> mi s c„f eature 

<222> (29) . • (29) 

<223> a or c or g or t/u 



<400> 31 

caaattcttt ataccaagtc ggnggnarnc c 
31 



<210> 32 

<211> 31 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

< 2 2 1> mi s c_f eature 

<222> (23) . . (23) 

<223> a or c or g or t/u 
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<400> 32 

ccatatatcg catttcagct gwngwrtccc 
31 



<210> 33 

<211> 24 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

<221> mi s c__f eature 

<222> (16) . . (16) 

<223> a or c or g or t/u 



<220> 

<2 2 1> misc_f eature 

<222> (22) . . (22) 

<223> a or c or g or t/u 



<400> 33 

ggtcgtggcc aaggcntggr ynga 
24 



<210> 34 

<211> 22 

<212> DNA 

<213> Artificial 

<220> 

<223> Primer 
<220> 

<221> misc_f ea tur e 

<222> (14) . . (14) 

<223> a or c or g or t/u 



<220> 

<2 2 1 > mi s c_f eature 

<222> (20) . . (20) 

<223> a or c or g or t/u 



<400> 34 

ggccggtcct gggnytsccn cc 
22 



<210> 35 
<211> 26 
<212> DNA 
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12 



10 



<213> Artificial 
<220> 

<223> Primer 
<220> 

< 2 2 1 > mi s c_f eature 

<222> (18).. (18) 

<223> a or c or g or t/u 



<220> 

< 2 2 1 > mi s c_f eature 
<222> ' (24) . . (24) 
15 <223> a or c or g or t/u 



0 



<400> 35 

tccttgtacc aggtcggngg sarncc 
26 



25 



30 



35 



0 



<210> 


36 


<211> 


24 


<212> 


DNA 


<213> 


Artificial 


<220> 




<223> 


Primer 


<220> 




<221> 


mis cofeature 


<222> 


(16) . . (16) 


<223> 


a or c or g 


<400> 


36 



or t/u 



gcgcatttcg gcgswnswrt ccca 
24 



45 



<210> 
<211> 
<212> 
<213> 



37 

705 

DNA 

Unknown 



<220> 



<223> Metagenome - alpha unit nitrile hydratase 



M6aH6 



50 



<220> 
<221> 
<222> 
<223> 



CDS 
(1) 



. (705) 



55 <400> 37 

atg age aag cac gta cac gat tac tac gcg aag aag aag cac gac cac 

Met Ser Lys His Val His Asp Tyr Tyr Ala Lys Lys Lys His Asp His 

c 10 lb 
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13 



gat cat gac cac gac gtc cac gag gcg ate gag gac egg gac gag ggt 

ASP His Asp His Asp Val His Glu Ala lie Glu Asp Arg Asp Glu Gly 

20 25 30 

ccg ccg teg gaa ttc gag ate atg age cgc gee atg cag gag ctg ctg 
144 

Pro Pro Ser Glu Phe Glu He Met Ser Arg Ala Met Gin Glu Leu Leu 
35 40 45 

gaa gag aag ggc gtc gtc ace gcg gag cag gtc egg cgc age atg gag 
192 

Glu Glu Lys Gly Val Val Thr Ala Glu Gin Val Arg Arg Ser Met Glu 
50 55 60 

aag ttc gag gaa gag ctg ccc tac egg ggg gcg egg gtc gtc gcg cac 
240 

Lvs Phe Glu Glu Glu Leu Pro Tyr Arg Gly Ala Arg Val Val Ala His 
65 70 75 80 

gee tgg ace gac ccg gaa ttc aag aag egg ctg ctg gcg gac ggc aag 
2 88 

Ala Trp Thr Asp Pro Glu Phe Lys Lys Arg Leu Leu Ala Asp Gly Lys 

85 90 95 

gee gee gtc teg gag ttc ggc ate gat ttg gaa gee gag egg ctg ate 

Ala Ala Val Ser Glu Phe Gly He Asp Leu Glu Ala Glu Arg Leu He 

100 105 11° 

gcg gtc gcg aac aca acg gac gtg cac aac gtc ate gtg tgc acg ctg 

^ 84 

Ala Val Ala Asn Thr Thr Asp Val His Asn Val He Val Cys Thr Leu 
115 120 I 25 

tgc teg tgc tac ccg cgc acg ctg etc ggc atg ccg ccg ace tgg tac 

432 

Cys Ser Cys Tyr Pro Arg Thr Leu Leu Gly Met Pro Pro Thr Trp Tyr 
130 135 • I 40 

aag age gat aac tac cgc teg cgc gtg gtc tac gaa ccg cgc gcg gtg 

Lys Ser Asp Asn Tyr Arg Ser Arg Val Val Tyr Glu Pro Arg Ala Val 
145 150 I 55 

ctg aag gaa ttc ggc ace gtg ctg ccg gag cgc gtc acc gtg cgc gtg 

III Lys Glu Phe Gly Thr Val Leu Pro Glu Arg Val Thr Val Arg Val 

165 170 i75 

cac gac tec aac gee gac atg cgc tac gtg gtg ate ccc atg cgc ccg 

His Asp Ser Asn Ala Asp Met Arg Tyr Val Val He Pro Met Arg Pro 

180 I 85 



cag gga acc gag ggc tgg age gag gag egg etc gcg gag ctg ctg acg 
Gin Gly Thr Glu Gly Trp Ser Glu Glu Arg Leu Ala Glu Leu Leu Thr 
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14 

195 200 205 

cgc gac acg ctg gtg ggg gtc acc gtg cca aaa gtg gaa gtc gga agt 
672 

5 Arg Asp Thr Leu Val Gly Val Thr Val Pro Lys Val Glu Val Gly Ser 
210 215 220 

cga aag teg aaa ggc gga agt aaa acc cgc tag 
705 

10 Arg Lys Ser Lys Gly Gly Ser Lys Thr Arg 
225 230 



<210> 38 

15 <211> 234 

<212> PRT 

<213> Unknown 

<220> 

0 <223> Metagenome - alpha unit nitrile hydratase - M6aH6 
<400> 38 

Met Ser Lys His Val His Asp Tyr Tyr Ala Lys Lys Lys His Asp His 
25 1 5 10 15 

Asp His Asp His Asp Val His Glu Ala lie Glu Asp Arg Asp Glu Gly 

20 25 30 



30 



35 



Pro Pro Ser Glu Phe Glu lie Met Ser Arg Ala Met Gin Glu Leu Leu 
35 40 45 

Glu Glu Lys Gly Val Val Thr Ala Glu Gin Val Arg Arg Ser Met Glu 
50 * 55 60 




0 Lys Phe Glu Glu Glu Leu Pro Tyr Arg Gly Ala Arg Val Val Ala His 
65 70 75 80 

Ala Trp Thr Asp Pro Glu Phe Lys Lys Arg Leu Leu Ala Asp Gly Lys 
45 85 90 

Ala Ala Val Ser Glu Phe Gly He Asp Leu Glu Ala Glu Arg Leu He 

100 105 110 

Ala Val Ala Asn Thr Thr Asp Val His Asn Val He Val Cys Thr Leu 
115 120 125 

Cys Ser Cys Tyr Pro Arg Thr Leu Leu Gly Met Pro Pro Thr Trp Tyr 
130 135 140 



50 



55 



15 



Lys Ser Asp Asn Tyr Arg Ser Arg Val Val Tyr Glu Pro Arg Ala Val 
145 150 155 1& U 

Leu Lys Glu Phe Gly Thr Val Leu Pro Glu Arg Val Thr Val Arg Val 

165 170 175 

His Asp Ser Asn Ala Asp Met Arg Tyr Val Val lie Pro Met Arg Pro 

180 185 190 

Gin Gly Thr Glu Gly Trp Ser Glu Glu Arg Leu Ala Glu Leu Leu Thr 
195 200 205 

Arg Asp Thr Leu Val Gly Val Thr Val Pro Lys Val Glu Val Gly Ser 
2io 215 220 

Arg Lys Ser Lys Gly Gly Ser Lys Thr Arg 
225 230 



<210> 39 

<211> 657 

<212> DNA 

<213> Unknown 

<220> 

<223> Metagenome - alpha unit nitrile hydratase - M12K24 
<220> 

<221> CDS 

<222> (1) . . (657) 

<223> 



atg°tcg 3 gac gga aca aca att gga ate cag gec gcg aca acc ctt cga 



<400> 39 
at< 

A o 

Met Ser Asp Gly Thr Thr He Gly He Gin Ala Ala Thr Thr Leu Arg 

i- 1 n 15 



1 5 10 

tea gec atg aac att cca get cgt gaa ttc gec etc cag cgc act gcg 

ler Ala Met Asn He Pro Ala Arg Glu Phe Ala Leu Gin Arg Thr Ala 

20 - 25 30 

ccg gtc gag cag cgt gtc gac gcg ate cag gcg gcg etc gac gaa cgc 

Pro Val Glu Gin Arg Val Asp Ala He Gin Ala Ala Leu Asp Glu Arg 
35 40 45 

ggt ttg aac gec agt gac gca gtc cag gaa ttg age cac ctg gcg gag 

Gly Leu Asn Ala Ser Asp Ala Val Gin Glu Leu Ser His Leu Ala Glu 
" - 60 



50 55 
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16 



gag caa tgg att ccg cgc aat ggc gcg egg gtc gtc gec aaa gec tgg 

llu Gin Trp He Pro Arg Asn Gly Ala Arg Val Val Ala Lys Ala Trp 
65 70 75 80 

gtc gac ccg gaa ttc cgc gcg egg ctt ctg gec gac ggt cgc gec gee 
288 

Val Asp Pro Glu Phe Arg Ala Arg Leu Leu Ala Asp Gly Arg Ala Ala 

85 9° 95 

gtt gee gaa ctg ggc etc teg atg ccg aag cat cac egg cac etc gtg 

111 Ala Glu Leu Gly Leu Ser Met Pro Lys His His Arg His Leu Val 

100 105 110 



gtg ctg gag aac acg ccg age gtg cag aac gtc ate 

384 -, ,r T Tl 

Val Leu Glu Asn Thr Pro Ser Val Gin Asn Val He 
115 120 

tgc teg tgc acg gcg ttc acg ate ate gga ctg ccg 

432 , 
Cys Ser Cys Thr Ala Phe Thr He He Gly Leu Pro 
130 135 140 

aag gac ctg gaa tac cgc gcg cga gtc gtc egg gag 
480 

Lys Asp Leu Glu Tyr Arg Ala Arg Val Val Arg Glu 
145 150 155 

ctg aag gag atg gga ctg gat ctg cct egg gat gtc 

52 8 _ _ -i 

Leu Lys Glu Met Gly Leu Asp Leu Pro Arg Asp Val 

165 170 



tgc tgc acg cag 

Cys Cys Thr Gin 
125 

ccc gac tgg tac 
Pro Asp Trp Tyr 



teg cgc acc gtg 

Ser Arg Thr Val 

160 

gaa att cgc gtc 

Glu He Arg Val 
175 



tgg gat acc act gec gac acg cgc tac atg gta ttg ccg gta cag ccg 

Trp Asp Thr Thr Ala Asp Thr Arg Tyr Met Val Leu Pro Val Gin Pro 

180 185 

ccg gaa acc ate ggc tgg ccc gag gag aaa ctg gtc gac ate gtg acg 

Pro Glu Thr He Gly Trp Pro Glu Glu Lys Leu Val Asp He Val Thr 
195 200 20 

cgc gac ggc atg ate ggc gtc gcg egg gta tag 
657 

Arg Asp Gly Met He Gly Val Ala Arg Val 
210 215 



<210> 

<211> 
<212> 
<213> 



40 

218 

PRT 

Unknown 



<220> 

<223> Metagenome - 



alpha unit nitrile hydratase - M12K24 
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17 



5 



<400> 40 

Met Ser Asp Gly Thr Thr He Gly He Gin Ala Ala Thr Thr Leu Arg 
± 5 10 15 

Ser Ala Met Asn He Pro Ala Arg Glu Phe Ala Leu Gin Arg Thr Ala 

20 25 30 



10 

Pro Val Glu Gin Arg Val Asp Ala He Gin Ala Ala Leu Asp Glu Arg 
35 • • 40 45 

15 Gly Leu Asn Ala Ser Asp Ala Val Gin Glu Leu Ser His Leu Ala Glu 

50 55 60 

Glu Gin Trp He Pro Arg Asn Gly Ala Arg Val Val Ala Lys Ala Trp 
0 65 70 75 80 

Val Asp Pro Glu Phe Arg Ala Arg Leu Leu Ala Asp Gly Arg Ala Ala 

85 90 95 

25 

Val Ala Glu Leu Gly Leu Ser Met Pro Lys His His Arg His Leu Val 

100 105 H° 

Val Leu Glu Asn Thr Pro Ser Val Gin Asn Val He Cys Cys Thr Gin 
115 120 125 

35 Cys Ser Cys Thr Ala Phe Thr He He Gly Leu Pro Pro Asp Trp Tyr 

130 135 140 

Lys Asp Leu Glu Tyr Arg Ala Arg. Val Val Arg Glu Ser Arg Thr Val 
40 145 150 155 160 

Leu Lys Glu Met Gly Leu Asp Leu Pro Arg Asp Val Glu He Arg Val 

165 170 175 

45 

Trn Asp Thr Thr Ala Asp Thr Arg Tyr Met Val Leu Pro Val Gin Pro 

180 185 190 

50 

Pro Glu Thr He Gly Trp Pro Glu Glu Lys Leu Val Asp He Val Thr 
195 200 205 

55 Arg Asp Gly Met He Gly Val Ala Arg Val 

210 215 



<210> 41 
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<211> 699 

<212> DNA 

<213> Unknown 

<223> Metagenome - alpha unit nitrile hydratase - M29M24 
<220> 

<221> CDS 

<222> (1) . . (699) 

<223> 

<400> 41 

atg gag acg aca cgc cgc ggc ttc ttg aag aaa gcc ggg acc gcc gcc 
4 8 

Met Glu Thr Thr Arg Arg Gly Phe Leu Lys Lys Ala Gly Thr Ala Ala 
1 5 10 15 

ggt gcg acg get gca ccc gtt gga etc gcc aag ate get cac tec cac 

Gly Ala Thr Ala Ala Pro Val Gly Leu Ala Lys lie Ala His Ser His 

20 25 30 

gag cac cag gcc gtt cct tec gac etc acg etc egg gtc aag tec etc 
144 

Glu His Gin Ala Val Pro Ser Asp Leu Thr Leu Arg Val Lys Ser Leu 
35 40 45 

gaa teg ctg ctg gtc gag aag ggt etc gtg gac cgt gag gcc etc gac 
192 

Glu Ser Leu Leu Val Glu Lys Gly Leu Val Asp Arg Glu Ala Leu Asp 
50 55 60 

gtg etc gtc gat acc tac gag aac aag ate ggt ccg cga aac ggc get 

val Leu Val Asp Thr Tyr Glu Asn Lys He Gly Pro Arg Asn Gly Ala 
65 70 75 80 

cgc gtc gtc gcg egg gcg tgg gtc gat ccc gcg tac aaa gag cgc ctg 

Arg Val Val Ala Arg Ala Trp Val Asp Pro Ala Tyr Lys Glu Arg Leu 

85 90 95 

ctg aaa gac gcc acc teg gcg ate gcc gag etc ggt tac acc gga gcc 

Leu Lys Asp Ala Thr Ser Ala He Ala Glu Leu Gly Tyr Thr Gly Ala 

100 105 110 

cag ggt gag cac atg gtg gcg etc gag aat acc ccc gcg gtg cac aac 
3 84 

Gin Gly Glu His Met Val Ala Leu Glu Asn Thr Pro Ala Val His Asn 

115 120 125 

etc gtc gtt tgc acg etc tgc tec tgc tat cca tgg ccg gtg etc ggt 

Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly 
130 135 I 40 
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ctg ccc ccg gtc tgg tac aaa teg gcg ccc tac cga teg cgc teg gtc 

480 , _ _ _ -i 

Leu Pro Pro Val Trp Tyr Lys Ser Ala Pro Tyr Arg Ser Arg Ser Val 
145 150 155 160 

ate gat ccg cgc ggc gtt etc ggc gag ttc ggg etc gag ctg ccg gaa 

He Asp Pro Arg Gly Val Leu Gly Glu Phe Gly Leu Glu Leu Pro Glu 

165 170 175 

ggg gtc gag gtg cgc gtc tgg gac teg acg gcg gag etc egg tat etc 

111 Val Glu Val Arg Val Trp Asp Ser Thr Ala Glu Leu Arg Tyr Leu 

180 185 190 

gtt ttg ccg gag egg ccc gaa ggc acg gcg caa ctg age gaa gaa gcg 

Val Leu Pro Glu Arg Pro Glu Gly Thr Ala Gin Leu Ser Glu Glu Ala 
195 200 205 

etc gcg gat etc gtc acc egg gat gee atg ate ggc gtc gcg aaa gtc 
672 

Leu Ala Asp Leu Val Thr Arg Asp Ala Met He Gly Val Ala Lys Val 
210 215 220 

teg ttg ccc gcg ggc ggc gee gaa tga 
699 

Ser Leu Pro Ala Gly Gly Ala Glu 
225 230 



<210> 42 

<211> 232 

<212> PRT 

<213> Unknown 

<223> Metagenome - alpha unit nitrile hydratase - M29M24 

<400> 42 

Met Glu Thr Thr Arg Arg Gly Phe Leu Lys Lys Ala Gly Thr Ala Ala 
1 5 1° 15 

Gly Ala Thr Ala Ala Pro Val Gly Leu Ala Lys He Ala His Ser His 

20 . 25 30 

Glu His Gin Ala Val Pro Ser Asp Leu Thr Leu Arg Val Lys Ser Leu 
35 40 45 



Glu Ser Leu Leu Val Glu Lys Gly Leu Val Asp Arg Glu Ala Leu Asp 
50 



55 60 



Val Leu Val Asp Thr Tyr Glu Asn Lys He Gly Pro Arg Asn Gly Ala 
65 70 75 
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Arc val Val Ala Arg Ala Trp Val Asp Pro Ala Tyr Lys Glu Arg Leu 

85 90 95 

Leu Lys Asp Ala Thr Ser Ala lie Ala Glu Leu Gly Tyr Thr Gly Ala 

100 105 H° 

Gin Gly Glu His Met Val Ala Leu Glu Asn Thr Pro Ala Val His Asn 
115 120 I 25 

Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly 
130 135 140 

Leu Pro Pro Val Trp Tyr Lys Ser Ala Pro Tyr Arg Ser Arg Ser Val 
145 150 155 160 

lie Asp Pro Arg Gly Val Leu Gly Glu Phe Gly Leu Glu Leu Pro Glu 

165 170 175 

Gly Val Glu Val Arg Val Trp Asp Ser Thr Ala Glu Leu Arg Tyr Leu 

180 185 190 

Val Leu Pro Glu Arg Pro Glu Gly Thr Ala Gin Leu Ser Glu Glu Ala 
195 200 205 

Leu Ala Asp Leu Val Thr Arg Asp Ala Met lie Gly Val Ala Lys Val 
210 ' 215 220 



Ser Leu Pro Ala Gly Gly Ala Glu 
225 230 



<210> 43 

<211> 639 

<212> DNA 

<213> Unknown 

<2 2 0> 

<223> Metagenome - alpha unit nitrile hydratase - M2K17 

<220> 

<221> CDS 

<222> (1) . . (639) 

<223> 

<400> 43 „ _ 

atg cct gac gac cat gcc cat ccg gat gat cat gcg cat ggc teg gaa 

, i _ „ . a Aqn astd His Ala His Gly Ser Glu 

Met Pro Asp Asp His Ala His Pro Asp asp nib ^ _r 
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« 

1 5 10 15 

ttg tec gag atg gat ate egg gtg egg gcg ctg gag acc ate ctg acc 

Leu Ser Glu Met Asp lie Arg Val Arg Ala Leu Glu Thr lie Leu Thr 

20 25 30 

gag aag ggc tat gtc gat ccg gcg gcg etc gac egg ate gtc gag gcg 
144 

Glu Lys Gly Tyr Val Asp Pro Ala Ala Leu Asp Arg lie Val Glu Ala 
35 40 45 

ttc gag acc agg ate ggc ccg cat ate ggc gee cgt ate gtg gca egg 
192 

Phe Glu Thr Arg. He Gly Pro His He Gly Ala Arg He Val Ala Arg 
50 55 SO 

get tgg gee gac gec gaa ttc aag egg egg ctg etc gee gac gcg acc 

240 n m , 

Ala Trp Ala Asp Ala Glu Phe Lys Arg Arg Leu Leu Ala Asp Ala Thr 
65 70 75 80 

gag gcg gcg aat teg ctg ggt cat gcg age ccg gtc ggc age cat ctg 

Glu Ala Ala Asn Ser Leu Gly His Ala Ser Pro Val Gly Ser His Leu 

85 90 95 

atc gcg gtc gag aac a cg ccg cag acc cac aac etc gtc gtc tgc act 

lie Ala Val Glu Asn Thr Pro Gin Thr His Asn Leu Val Val Cys Thr 

100 105 110 

ttg tgc teg tgt tat ccg tgg gag gtg ctg gga ttg ccg ccg gtc tgg 
3 84 

Leu Cys Ser Cys Tyr Pro Trp Glu Val Leu Gly Leu Pro Pro Val Trp 
115 120 125 

tac aaa tec get gee tac cgc teg cgc gtg gtg atc gac ccc aag ggc 

Tyr Lys Ser Ala Ala Tyr Arg Ser Arg Val Val He Asp Pro Lys Gly 
130 135 140 

gtc etc gee gag ttc ggc ctg acc ctg cca ccg gag acc ggg atc cgc 

Val Leu Ala Glu Phe Gly Leu Thr Leu Pro Pro Glu Thr Gly He Arg 
145 150 155 160 

atc tgg gat teg acc gee gag acc egg ttt ctg gtg gtg ccg atg egg 

He Trp Asp Ser Thr Ala Glu Thr Arg Phe Leu Val Val Pro Met Arg 

165 170 175 

ccc ccc ggc acc gca ggc tgg age gag gaa egg etc gee gaa etc gtc 

Pro Pro Gly Thr Ala Gly Trp Ser Glu Glu Arg Leu Ala Glu Leu Val 

180 I 85 190 

acc cgc gac age atg atc ggc act ggt ctg gee ggg gcg ccg cag gag 
624 
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Thr Arg Asp Ser Met He Gly Thr Gly Leu Ala Gly Ala Pro Gin Glu 
195 200 205 



atg gcc teg gca tga 
639 

Met Ala Ser Ala 
210 



<210> 44 

<211> 212 

<212> PRT 

<213> Unknown 



<220> 

<223> Metagenome - alpha unit nitrile hydratase - M2K17 
<400> 44 

Met Pro Asp Asp His Ala His Pro Asp Asp His Ala His Gly Ser Glu 
1 5 10 15 

Leu Ser Glu Met Asp He Arg Val Arg Ala Leu Glu Thr He Leu Thr 

20 25 30 

Glu Lys Gly Tyr Val Asp Pro Ala Ala Leu Asp Arg He Val Glu Ala 
35 . 40 45 

Phe Glu Thr Arg He Gly Pro His He Gly Ala Arg He Val Ala Arg 
50 55 60 

Ala Trp Ala Asp Ala Glu Phe Lys Arg Arg Leu Leu Ala Asp Ala Thr 
65 70 75 80 

Glu Ala Ala Asn Ser Leu Gly His Ala Ser Pro Val Gly Ser His Leu 

85 9° 95 

He Ala Val Glu Asn Thr Pro Gin Thr His Asn Leu Val Val Cys Thr 

100 105 HO 

Leu Cys Ser Cys Tyr Pro Trp Glu Val Leu Gly Leu Pro Pro Val Trp 
H5 120 125 

Tyr Lys Ser Ala Ala Tyr Arg Ser Arg Val Val He Asp Pro Lys Gly 
130 135 140 

Val Leu Ala Glu Phe Gly Leu Thr Leu Pro Pro Glu Thr Gly He Arg 
145 150 155 
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lie Trp Asp Ser Thr Ala Glu Thr Arg Phe Leu Val Val Pro Met Arg 

165 170 175 

Pro Pro" Gly Thr Ala Gly Trp Ser Glu Glu Arg Leu Ala Glu Leu Val 

180 185 190 

Thr Arg, Asp Ser Met lie Gly Thr Gly Leu Ala Gly Ala Pro Gin Glu 
195 200 ' 205 



Met Ala Ser Ala 
210 



<210> 45 

<211> 696 

<212> DNA 

<213> Unknown 

<220> 

<223> Metagenome - alpha unit nitrile hydratase - M15aA6 
<22 0> 

<221> CDS 

<222> (1)..(696) 

<223> 

<400> 45 

atg cgt teg ccc ggt gag gcc tea gca acg caa cca gcg etc att egg 

Met Arg Ser Pro Gly Glu Ala Ser Ala Thr Gin Pro Ala Leu lie Arg 
1 5 10 . 15 

ctg cat gat cga get ggc ggc gtt cga tea ttg cgc ggc aaa agg tct 

Leu His Asp Arg Ala Gly Gly Val Arg Ser Leu Arg Gly Lys Arg Ser 

20 25 30 

cat cgc gcc gga teg cat cct egg ggc get cgc gca tec gtc gcc aca 

His Arg Ala Gly Ser His Pro Arg Gly Ala Arg Ala Ser Val Ala Thr 
35 40 45 

ggg tgg ttc gtt ccg ttc teg gcc agg etc gcc egg aaa ggc ate get 
192 

Gly Trp Phe Val Pro Phe Ser Ala Arg Leu Ala Arg Lys Gly He Ala 
50 55 60 

cct ccg gcc gag ate gcc gag egg ate gcc gtc acc gat cgc gca tea 

Pro Pro Ala Glu He Ala Glu Arg He Ala Val Thr Asp Arg Ala Ser 
65 70 75 80 

ccg gca atg ggc get cgc atg gtc gcc aag gcc tgg acc gat ccc gcc 

III Ala Met Gly Ala Arg Met Val Ala Lys Ala Trp Thr Asp Pro Ala 

85 90 95 
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ttc cgc acc ctg etc ttg gaa gac gga acc cgc gcg gcg gaa teg etc 

Phe Arg Thr Leu Leu Leu Glu Asp Gly Thr Arg Ala Ala Glu Ser Leu 

100 105 

ggc ate atg atg cgc ggc gec ccg cct etc ggt gtg ctg gag aat acg 

3 84 i_ 
Gly lie Met Met Arg Gly Ala Pro Pro Leu Gly Val Leu Glu Asn Thr 

115 120 125 

ccc gag att cat cac etc gtc gtt tgc acg ctg tgc agt tgt tac ccg 

432 

Pro Glu He His His Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro 
130 135 140 

cgc gcg gtg ctg ggc tat ccg ccg ttc tgg ttc aaa tec gee gee tac 

480 — _ _ 

Arg Ala Val Leu Gly Tyr Pro Pro Phe Trp Phe Lys Ser Ala Ala Tyr 
145 150 155 160 

egg gca cgt gcg gtg cgc gac ccg cgc ggt ctg ate gec gaa tgg ggc 

C O Q 

Arg Ala Arg Ala Val Arg Asp Pro Arg Gly Leu lie- Ala Glu Trp Gly 

165 l 70 

acc atg ctg ccc gac gat gtc cgc gtg cga gtg gtg gac agt acg gee 

Thr Met Leu Pro Asp Asp Val Arg Val Arg Val Val Asp Ser Thr Ala 

180 185 19° 

gac tat cgc tgg atg gtt ctg ccg gtg egg ccg gee ggc act gcg ggc 

As P Tyr Arg Trp Met Val Leu Pro Val Arg Pro Ala Gly Thr Ala Gly 
195 200 205 

tgg gat gag gag cgc etc gec gca ate gta cgc gaa ggc gat atg ate 
Trp Asp Glu Glu Arg Leu Ala Ala He Val Arg Glu Gly Asp Met He 



210 



215 220 



ggg gtg acc ate cct cgt ctt taa 
696 

Gly Val Thr He Pro Arg Leu 
225 230 



<210> 46 

<211> 231 

<212> PRT 

<2 1 3 > Unknown 



<223> Metagenome - alpha unit nitrile hydratase - M15aA6 
<400> 46 

Met Arg Ser Pro Gly Glu Ala Ser Ala Thr Gin Pro Ala Leu lie Arg 
15 1° 
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Leu His Asp Arg Ala Gly Gly Val Arg Ser Leu Arg Gly Lys Arg Ser 

20 25 30 

5 

His Arg Ala Gly Ser His Pro Arg Gly Ala Arg Ala Ser Val Ala Thr 
35 40 45 

Gly Trp Phe Val Pro Phe Ser Ala Arg Leu Ala Arg Lys Gly He Ala 
50 55 60 

15 Pro Pro Ala Glu He Ala Glu Arg He Ala Val Thr Asp Arg Ala Ser 
65 70 75 80 

Pro Ala Met Gly Ala Arg Met Val Ala Lys Ala Trp Thr Asp Pro Ala 
0 85 90 95 

Phe Arg Thr Leu Leu Leu Glu Asp Gly Thr Arg Ala Ala Glu Ser Leu 

100 105 110 

25 

Gly He Met Met Arg Gly Ala Pro Pro Leu Gly Val Leu Glu Asn Thr 
115 120 125 

30 Pro Glu He His His Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro 

130 135 I 40 

35 Arg Ala Val Leu Gly Tyr Pro Pro Phe Trp Phe Lys Ser Ala Ala Tyr 
145 150 155 

Arg Ala Arg Ala Val Arg Asp Pro Arg Gly Leu He Ala Glu Trp Gly 
0 165 170 

Thr Met Leu Pro Asp Asp Val Arg Val Arg Val Val Asp Ser Thr Ala 

180 .185 190 

45 

Asp Tyr Arg Trp Met Val Leu Pro Val Arg Pro Ala Gly Thr Ala Gly 
195 200 205 

Trp Asp Glu Glu Arg Leu Ala Ala He Val Arg Glu Gly Asp Met He 
210 215 220 



50 



55 Gly Val Thr He Pro Arg Leu 
225 230 



<210> 47 
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<211> 576 
<212> DNA 
<213> Unknown 

<220> 

<223> Metagenome - alpha unit nitrile hydratase - M23dA12 
<220> 

<221> CDS 

<222> (1) . . (576) 

<223> 

<400> 47 

atg cag ttg cgc gtg egg gcg ctg gaa acc gtt eta gec gaa aag ggt 

Met Gin Leu Arg Val Arg Ala Leu Glu Thr Val Leu Ala Glu Lys Gly 
1 5 10 15 

tat etc gat ccc gec gcg ctt gat gcg atg ate gaa gec tac gag acg 

?Jr Leu Asp Pro Ala Ala Leu Asp Ala Met lie Glu Ala Tyr Glu Thr 

20 25 30 

egg att ggg ccg cat aac ggc gcg cgc gtc gtc gee aag gee tgg tec 
144 

Arg He Gly Pro His Asn Gly Ala Arg Val Val Ala Lys Ala Trp Ser 

35 40 45 

gac gec gca ttc aag cga gcg ctg gtc gag gat gcg acc aag gee gtg 
192 

Asp Ala Ala Phe Lys Arg Ala Leu Val Glu Asp Ala Thr Lys Ala Val 
50 55 60 

cag teg ttc ggc gtg gtc aat cgc gtc ggc gat cac ctg ate gcg gtc 
240 

Gin Ser Phe Gly Val Val Asn Arg Val Gly Asp His Leu lie Ala Val 
65 70 75 80 

gag aac acg ccc acg ctg cac aac ate ate gtg tgc acg ttg tgc tec 
2 88 

Glu Asn Thr Pro Thr Leu His Asn He lie Val Cys Thr Leu Cys Ser 

85 90 95 

tgc tat ccg tgg gaa gtg etc ggc ctg ccg ccg gtc tgg tac aaa teg 
33 6 

Cys Tyr Pro Trp Glu Val Leu Gly Leu Pro Pro Val Trp Tyr Lys Ser 

100 105 110 

gcg ccc tac cgc teg cgc gcg gtc aac gac ccg cgc ggg gta etc gee 
384 

Ala Pro Tyr Arg Ser Arg Ala Val Asn Asp Pro Arg Gly Val Leu Ala 
115 120 125 

gat ttc ggc ctg aag ctg gcg ccg gat atg caa ate cgt gtc tgg gat 
432 

Asp Phe Gly Leu Lys Leu Ala Pro Asp Met Gin He Arg Val Trp Asp 
130 135 140 
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teg acc gec gag acg cgc ttc ate gtg ttg ccg atg cgc ccg gec gga 

480 n _ 

Ser Thr Ala Glu Thr Arg Phe lie Val Leu Pro Met Arg Pro Ala Gly 
145 150 155 160 

acc gac ggc tgg age gaa gaa aag etc gee gcg ctg gtg aca cgc gat 

Thr Asp Gly Trp Ser Glu Glu Lys Leu Ala Ala Leu Val Thr Arg Asp 

165 170 175 

tgc atg ate ggc acc ggc tta ccc aag caa ccc aac gag gtc acg taa 

576 , 
Cvs Met He Gly Thr Gly Leu Pro Lys Gin Pro Asn Glu Val Thr 

180 185 190 



<210> 48 

<211> 191 

<212> PRT 

<213> Unknown 

<2 2 0> 

<223> Metagenome - alpha unit nitrile hydratase - M23dAl2 
<400> 48 

Met Gin Leu Arg Val Arg Ala Leu Glu Thr Val Leu Ala Glu Lys Gly 
1 5 10 

Tvr Leu Asp Pro Ala Ala Leu Asp Ala Met lie Glu Ala Tyr Glu Thr 

20 25 30 

Arg lie Gly Pro His Asn Gly Ala Arg Val Val Ala Lys Ala Trp Ser 
35 40 45 

Asp Ala Ala Phe Lys Arg Ala Leu Val Glu Asp Ala Thr Lys Ala Val 
50 55 60 

Phe Gly Val Val Asn Arg Val Gly Asp His Leu lie Ala Val 



Gin Ser 
65 70 



75 80 



Glu Asn Thr Pro Thr Leu His Asn lie He Val Cys Thr Leu Cys Ser 

85 90 95 



Cvs Tyr Pro Trp Glu Val Leu Gly Leu Pro Pro Val Trp Tyr Lys Ser 

100 105 11° 

Ala Pro Tyr Arg Ser Arg Ala Val Asn Asp Pro Arg Gly Val Leu Ala 
115 120 125 



Phe Gly Leu Lys Leu Ala Pro Asp Met Gin lie Arg Val Trp Asp 
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28 



135 140 



Ser Thr Ala Glu Thr Arg Phe lie Val Leu Pro Met Arg Pro Ala Gly 
145 150 155 160 

Thr Asp Gly Trp Ser Glu Glu Lys Leu Ala Ala Leu Val Thr Arg Asp 

165 170 I 75 

Cvs Met lie Gly Thr Gly Leu Pro Lys Gin Pro Asn Glu Val Thr 

180 185 190 



<210> 49 

<211> 624 

<212> DNA 

<213> Unknown 

<223> Metagenome - alpha unit nitrile hydratase - M49bD9 
<220> 

<221> CDS 

<222> (1) . . (624) 

<223> 

<400> 49 ^.^ 
atg age gag cac gat tec ggc gaa age cat cac cat ccg cag cca eta 

4 8 

Met Ser Glu His Asp Ser Gly Glu Ser His His His Pro Gin Pro Leu 
1 5 10 15 

teg cag gcg gca ttg cgc gcg aag gcg ate gaa teg ctg ctg gtc gaa 

ler Gin Ala Ala Leu Arg Ala Lys Ala He Glu Ser Leu Leu Val Glu 

20 25 30 

aag ggg ctg ate gcg acc gac gtg ate gat cgc gtg gta gca acg tac 

Lys Gly Leu He Ala Thr Asp Val He Asp Arg Val Val Ala Thr Tyr 
* 35 40 45 

gag aaa gaa gtc ggg ccg etc aac ggc get aaa gtc gtc gcg egg gee 

Glu Lys Glu Val Gly Pro Leu Asn Gly Ala Lys Val Val Ala Arg Ala 
50 55 60 

tgg acc gat ccg gag tac cgc cgc aga ctg etc aag aac ggc acg gcg 

Trp Thr Asp Pro Glu Tyr Arg Arg Arg Leu Leu Lys Asn Gly Thr Ala 
65 70 75 

geg att gec gag ctg gga ttc ggc ggc ttg cag ggc gaa cac atg atg 

III He Ala Glu Leu Gly Phe Gly Gly Leu Gin Gly Glu His Met Met 

90 y => 



85 
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gtc gtg gaa aac acg ccg tec gta cat aac gtg ate tgt tgc acg eta 

Val Val Glu Asn Thr Pro Ser Val His Asn Val lie Cys Cys Thr Leu 

100 105 HO 

tgc tea tgc tat ccg tgg ccg gtc ctg gga ctt ccg ccg age tgg tac 
384 

Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Ser Trp Tyr 
115 120 125 

aag teg ctg gcg tat cgt teg cga ate gtg cgc gag ccg cgc gee gtc 
432 

Lys Ser Leu Ala Tyr Arg Ser Arg lie Val Arg Glu Pro Arg Ala Val 
130 135 140 

etc ggc gaa ttc ggc etc gaa ttg ccc gaa acg gtg gaa gtc cgc gta 
480 

Leu Gly Glu Phe Gly Leu Glu Leu Pro Glu Thr Val Glu Val Arg Val 

145 150 155 160 

tgg gat age agt get gag atg cgc tat etc gtg ttg ccg gag cgt cca 
52 8 

Trp Asp Ser Ser Ala Glu Met Arg Tyr Leu Val Leu Pro Glu Arg Pro 

165 170 175 

gcg gga acg acg gag ttg age gaa gcg gaa ttg get tea ttg ate acg 

Ala Gly Thr Thr Glu Leu Ser Glu Ala Glu Leu Ala Ser Leu lie Thr 

180 185 190 

cgc gat gee ttg ate ggc gtg gcg aaa gtc gcg gcg cca age cgc tag 
624 

Arg Asp Ala Leu lie Gly Val Ala Lys Val Ala Ala Pro Ser Arg 



195 



<210> 50 

<211> 207 

<212> PRT 

<213> Unknown 



200 205 



<223> Metagenome - alpha unit nitrile hydratase - M49bD9 
<400> 50 

Met Ser Glu His Asp Ser Gly Glu Ser His His His Pro Gin Pro Leu 
15 10 15 

Ser Gin Ala Ala Leu Arg Ala Lys Ala He Glu Ser Leu Leu Val Glu 

20 25 30 

Lys Gly Leu He Ala Thr Asp Val He Asp Arg Val Val Ala Thr Tyr 
35 40 45 

Glu Lys Glu Val Gly Pro Leu Asn Gly Ala Lys Val Val Ala Arg Ala 
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30 



55 60 



Trp Thr Asp Pro Glu Tyr Arg Arg Arg Leu Leu Lys Asn Gly Thr Ala 
65 70 75 80 

Ala lie Ala Glu Leu Gly Phe Gly Gly Leu Gin Gly Glu His Met Met 

85 90 95 

Val Val Glu Asn Thr Pro Ser Val His Asn Val He Cys Cys Thr Leu 

100 105 HO 

Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Ser Trp Tyr 
115 120 I 25 

Lys Ser Leu Ala Tyr Arg Ser Arg He Val Arg Glu Pro Arg Ala Val 
130 135 140 

Leu Gly Glu Phe Gly Leu Glu Leu Pro Glu Thr Val Glu Val Arg Val 
145 150 155 l fou 

Trp Asp Ser Ser Ala Glu Met Arg Tyr Leu Val Leu Pro Glu Arg Pro 

165 l" 70 175 

Ala Gly Thr Thr Glu Leu Ser Glu Ala Glu Leu Ala Ser Leu He Thr 



180 



Arg Asp Ala Leu He Gly Val Ala Lys Val Ala Ala Pro Ser Arg 
195 200 205 



<210> 51 

<211> 600 

<212> DNA 

<213> Unknown 

<22 0> 

<223> Metagenome - alpha unit nitrile hydratase - M6dE2 
<220> 

<221> CDS 

<222> (1) . . (600) 

<223> 

atg°agc 5 aac cca cgc cgt cga gaa egg teg gec cca ccg gat gcg cga 

Met Ser Asn Pro Arg Arg Arg Glu Arg Ser Ala Pro Pro Asp Ala Arg 
1 5 10 
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gcc aag gcg etc gca gaa gcg ctt teg aag caa gga etc gtg ccg gaa 

Ala Lys Ala Leu Ala Glu Ala Leu Ser Lys Gin Gly Leu Val Pro Glu 

20 25 30 

ggg ttc etc gac cag gtc ggt tct cac gcc gcg gag gcg tgg age ccg 
144 

Gly Phe Leu Asp Gin Val Gly Ser His Ala Ala Glu Ala Trp Ser Pro 
35 40 45 

cga aac ggc gca egg gtc gtg gcg egg gcg tgg gtg gat ccc gag tac 
192 

Arg Asn Gly Ala Arg Val Val Ala Arg Ala Trp Val Asp Pro Glu Tyr 
50 55 60 

egg acg cgc ttg etc gcc gac ggc ace gcc gcg tgc gcc gcg etc ggc 

Arg Thr Arg Leu Leu Ala Asp Gly Thr Ala Ala Cys Ala Ala Leu Gly 
65 70 75 80 

tac gcg gga ccg cag gga gag tac ate gtg gta etc gaa gac acg ctg 

Tyr Ala Gly Pro Gin Gly Glu Tyr lie Val Val Leu Glu Asp Thr Leu 

85 90 • 9 5 

gcc gtt cac aac gtg ate gtg tgt acg caa tgc teg tgt act gcg tgg 

Ala Val His Asn Val He Val Cys Thr Gin Cys Ser Cys Thr Ala Trp 

100 105 110 

ccc gtg ctg ggg ctg ccg ccc gat tgg tac aag agt ccg gag tat cgc 

Pro Val Leu Gly Leu Pro Pro Asp Trp Tyr Lys Ser Pro Glu Tyr Arg 
115 120 125 

gcc cgc gtc gtg egg gag ccg cga egg gtg ctt cgc gaa atg ggc etc 

Ala Arg Val Val Arg Glu Pro Arg Arg Val Leu Arg Glu Met Gly Leu 
130 135 140 

gag eta tec gag age gtg acg ate cgc gtg tgg gat acg act gcg gaa 

Glu Leu Ser Glu Ser Val Thr He Arg Val Trp Asp Thr Thr Ala Glu 
145 150 155 

acg cgc ttc ctg gtg ctg ccg ctt egg ccg gcg gga ace gaa ggg tgg 

Tnr Arg Phe Leu Val Leu Pro Leu Arg Pro Ala Gly Thr Glu Gly Trp 

165 I 70 175 

age gcg gag cag etc gcg teg etc gtc acg cgc gag gcg atg ate ggc 
III Ala Glu Gin Leu Ala Ser Leu Val Thr Arg Glu Ala Met He Gly 

gtg gcg egg gtc gag gtg gtg tag 
600 

Val Ala Arg Val Glu Val Val 
195 
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<210> 52 

<211> 199 

<212> PRT 

<213> Unknown 

<223> Metagenome - alpha unit nitrile hydratase - M6dE2 

<400> 52 

Met Ser Asn Pro Arg Arg Arg Glu Arg Ser Ala Pro Pro Asp Ala Arg 
1 5 10 15 

Ala Lys Ala Leu Ala Glu Ala Leu Ser Lys Gin Gly Leu Val Pro Glu 

20 25 30 

Gly Phe Leu Asp Gin Val Gly Ser His Ala Ala Glu Ala Trp Ser Pro 
35 40 45 

Arg Asn Gly Ala Arg Val Val Ala Arg Ala Trp Val Asp Pro Glu Tyr 
50 55 60 

Arg Thr Arg Leu Leu Ala Asp Gly Thr Ala Ala Cys Ala Ala Leu Gly 
65 70 75 «<-> 

Tvr Ala Gly Pro Gin Gly Glu Tyr He Val Val Leu Glu Asp Thr Leu 

85 9° 95 

Ala Val His Asn Val He Val Cys Thr Gin Cys Ser Cys Thr Ala Trp 

100 105 HO 

Val Leu Gly Leu Pro Pro Asp Trp Tyr Lys Ser Pro Glu Tyr Arg 



Pro 

115 



120 I 25 



Ala Arg Val Val Arg Glu Pro Arg Arg Val Leu Arg Glu Met Gly Leu 
130 I 35 140 

Glu Leu Ser Glu Ser Val Thr He Arg Val Trp Asp Thr Thr Ala Glu 
145 150 155 I 60 

Thr Arg Phe Leu Val Leu Pro Leu Arg Pro Ala Gly Thr Glu Gly Trp 



165 



170 



Ala Glu Gin Leu Ala Ser Leu Val Thr Arg Glu Ala Met He Gly 



Ser 

180 



185 190 



040067 AM 



33 



Val Ala Arg Val Glu Val Val 
195 



<210> 53 

<211> 645 

<212> DNA 

<213> Unknown 



<223> Metagenome - alpha unit nitrile hydratase - M25A18 
<220> 

<221> CDS 

<222> (1) . . (645) 

<223> 

iJg 0 igc 5 ggc acg cat cac cac gac cat gac cac gat cat gac cat gcc 

Met Ser Gly Thr His His His Asp His Asp His Asp His Asp His Ala 
1 5 10 15 

cat ccg ggc gtc gcc aag gac gag aag gtc cac ggc tat tac caa ttg 

His Pro Gly Val Ala Lys Asp Glu Lys Val His Gly Tyr Tyr Gin Leu 

20 25 30 

etc ggc etc gcc ate aaa gag ctg ctg ate gaa aaa ggc gtc ate ace 

Leu Gly Leu Ala He Lys Glu Leu Leu He Glu Lys Gly Val He Thr • 
35 40 45 

gcc gcc gag gtg cgc caa gcg ate gag gcg cgc gac gcg ate acg ccg 

Ala Ala Glu Val Arg Gin Ala He Glu Ala Arg Asp Ala He Thr Pro 
50 55 60 

teg etc ggc ggc aag gtg gtc gcg cgc gcc tgg ace gat ccg gcc tac 

III Leu Gly Gly Lys Val Val Ala Arg Ala Trp Thr Asp Pro Ala Tyr 
65 70 75 

aag gcg egg ctg ate gcc gat ccc gcc gcc gcc atg atg gag atg ggc 

Lys Ala Arg Leu He Ala Asp Pro Ala Ala Ala Met Met Glu Met Gly 

85 90 

gtc gat etc ggc ccc acc gga etc gcc ate gcc gag aac acg ccg gag 

Val Asp Leu Gly Pro Thr Gly Leu Ala He Ala Glu Asn Thr Pro Glu 

100 105 110 

gcg cac aac gtc ate gtc tgc acc ctg tgc teg tgc tat ccg cgc gee 

3 84 7v ~\ 

Ala His Asn Val He Val Cys Thr Leu Cys Ser Cys Tyr Pro Arg Ala 
115 120 125 



040067 AM 



10 



15 




25 



34 



gtg etc ggc ctg ccg ccc tec tgg tac aag gac cgc gat tac egg teg 
432 

Val Leu Gly Leu Pro Pro Ser Trp Tyr Lys Asp Arg Asp Tyr Arg Ser 
130 135 140 

cgc gtg gtg cgc gag ccg cgc gee gtg etc aag gag ttc ggc acg gaa 

HI Val Val Arg Glu Pro Arg Ala Val Leu Lys Glu Phe Gly Thr Glu 
14 I 150 155 160 

ttg ccc gac gac gtc gac gtc cgc gtc cac gat teg acc gee gat ctg 
52 8 

Leu Pro Asp Asp Val Asp Val Arg Val His Asp Ser Thr Ala Asp Leu 

165 170 I 75 

cgc tat etc gtg ctg ccg atg cgc ccg gee ggc acc gag ggc atg age 

Ira Tyr Leu Val Leu Pro Met Arg Pro Ala Gly Thr Glu Gly Met Ser 

180 185 I 90 

gag gcg gag ctg gec gag ate gtg acg cgc gac tgc atg ate ggc gtg 

Glu Ala Glu Leu Ala Glu lie Val Thr Arg Asp Cys Met lie Gly Val 
195 200 205 

acg gtg ccg aaa gcg ccc taa 
645 

Thr Val Pro Lys Ala Pro 
210 



30 



35 



<210> 
<211> 
<212> 
<213> 



54 

214 

PRT 

Unknown 




<223> Metagenome - alpha unit nitrile hydratase - M25A18 
<400> 54 

Met Ser Gly Thr His His His Asp His Asp His Asp His Asp His Ala 
1 5 1° 



45 



His Pro Gly Val Ala Lys Asp Glu Lys Val His Gly Tyr Tyr Gin Leu 

20 25 30 



50 Leu Gly Leu Ala He Lys Glu Leu Leu He Glu Lys Gly Val He Thr 
" ' 35 40 45 



55 



Ala Ala Glu Val Arg Gin Ala He Glu Ala Arg Asp Ala He Thr Pro 
50 55 60 



Ser Leu Gly Gly Lys Val Val Ala Arg Ala Trp Thr Asp Pro Ala Tyr 
65 70 75 



040067 AM 



35 



Lys Ala Arg Leu lie Ala Asp Pro Ala Ala Ala Met Met Glu Met Gly 

85 90 95 

Val Asp Leu Gly Pro Thr Gly Leu Ala He Ala Glu Asn Thr Pro Glu 

100 105 HO 

Ala His Asn Val He Val Cys Thr Leu Cys Ser Cys Tyr Pro Arg Ala 
115 120 125 

Val Leu Gly Leu Pro Pro Ser Trp Tyr Lys Asp Arg Asp Tyr Arg Ser 
130 135 140 

Arg Val Val Arg Glu Pro Arg Ala Val Leu Lys Glu Phe Gly Thr Glu 
- 150 155 I 60 



145 



Leu Pro Asp Asp Val Asp Val Arg Val His Asp Ser Thr Ala Asp Leu 

165 170 175 

Arg Tyr Leu Val Leu Pro Met Arg Pro Ala Gly Thr Glu Gly Met Ser 

180 185 19° 

Glu Ala Glu Leu Ala Glu He Val Thr Arg Asp Cys Met He Gly Val 
195 200 205 



Thr Val Pro Lys Ala Pro 
210 



<210> 


55 


<211> 


627 


<212> 


DNA 


<213> 


Unknown 


<220> 




<223> 


Metagenome - 


<220> 




<221> 


CDS 


<222> 


(1) . . (627) 


<223> 




<400> 


55 


atg age ggt cac cat 


48 





alpha unit nitrile hydratase 



met ^tj-y ^^.^ — 

1 5 10 15 

acg ccg ate gaa gcg cgc gtg aag gcg ctg gaa teg ctg ctg gtc gcc 
96 



040067 AH 



Thr Pro lie Glu 

20 

aag ggc tat gtc 
144 

Lys Gly Tyr Val 
35 

gag acg aag ate 
192 

Glu Thr Lys lie 
50 

tgg acc gat ccg 
240 

Trp Thr Asp Pro 
65 

gec gtc gec gaa 
288 

Ala Val Ala Glu 



gec tgt ttc aat 
336 

Ala Cys Phe Asn 

100 

tgc teg tgc tat 
384 

Cys Ser Cys Tyr 
115 

aaa tec ccg ccc 
432 

Lys Ser Pro Pro 
130 

ctg gec gat ttc 
480 

Leu Ala Asp Phe 
145 

tgg gat tec acc 
528 

Trp Asp Ser Thr 



gee ggg acg gaa 
576 

Ala Gly Thr Glu 

180 

cgt gac age atg 
624 

Arg Asp Ser Met 
195 



Ala Arg Val Lys 

gat ccc gee gcg 

Asp Pro Ala Ala 

40 

ggc ccg cgc aac 

Gly Pro Arg Asn 
55 

gaa ttc gcg gcg 

Glu Phe Ala Ala 
70 

etc ggc tat ggc 

Leu Gly Tyr Gly 
85 

acg ccc gaa gag 
Thr Pro Glu Glu 

ccc tgg ccg gtg 

Pro Trp Pro Val 

120 

tat cgc teg aaa 

Tyr Arg Ser Lys 
135 

ggc gtg acc ctg 

Gly Val Thr Leu 
150 

gee gaa acc cgc 

Ala Glu Thr Arg 
165 

ggc tgg teg gaa 
Gly Trp Ser Glu 

ate ggc acc ggc 

lie Gly Thr Gly 

200 



36 

Ala Leu Glu Ser 
25 

etc gat gcg ate 
Leu Asp Ala lie 

ggc gee cgc gtc 

Gly Ala Arg Val 

60 

egg etc aag cag 

Arg Leu Lys Gin 
75 

ggg cgt ggc ggc 

Gly Arg Gly Gly 
90 

cac aac ctg ate 

His Asn Leu He 
105 

etc ggc ctg ccg 
Leu Gly Leu Pro 

gcg gtg ate gac 

Ala Val He Asp 

140 

ccg gag gga caa 

Pro Glu Gly Gin 
155 

ttc att gtc ate 

Phe He Val He 
170 

gaa cag ctg gcg 

Glu Gin Leu Ala 
185 

gtg gtc age gcg 
Val Val Ser Ala 



Leu Leu Val Ala 
30 

ate gac acc tat 

He Asp Thr Tyr 
45 

gtc gee aag gee 
Val Ala Lys Ala 

gat ggc age gec 

Asp Gly Ser Ala 

80 

gag cat ate gtc 

Glu His He Val 
95 

gtc tgc acg etc 

Val Cys Thr Leu 
110 

ccg gtc tgg tac 

Pro Val Trp Tyr 
125 

ccg cgc ggc gtg 
Pro Arg Gly Val 

agg ate cgc gtc 

Arg He Arg Val 

160 

ccc ctg cgc ccg 

Pro Leu Arg Pro 
175 

gcg ate gtg acg 

Ala He Val Thr 
190 

gag get teg cga 

Glu Ala Ser Arg 
205 



040067 AM 



37 



tga 
627 



<210> 56 

<211> 208 

<212> PPT 

<213> Unknown 

<220> 

<223> Metagenome - alpha unit nitrile hydratase 
<400> 56 

Met Ser Gly His His His Asp His Asp His Glu His Asp Asn His Phe 

K 10 15 



Thr Pro He Glu Ala Arg Val Lys Ala Leu Glu Ser Leu Leu Val Ala 

20 25 30 

Lys Gly Tyr Val Asp Pro Ala Ala Leu Asp Ala He He Asp Thr Tyr 
35 40 45 

Glu Thr Lys He Gly Pro Arg Asn Gly Ala Arg Val Val Ala Lys Ala 
50 55 60 

Trp Thr Asp Pro Glu Phe Ala Ala Arg Leu Lys Gin Asp Gly Ser Ala 
65 70 75 80 

Ala Val Ala Glu Leu Gly Tyr Gly Gly Arg Gly Gly Glu His He Val 

85 90 95 

Ala Cys Phe Asn Thr Pro Glu Glu His Asn Leu He Val Cys Thr Leu 

100 105 110 

Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Val Trp Tyr 
115 120 125 

Lys Ser Pro Pro Tyr Arg Ser Lys Ala Val He Asp Pro Arg Gly Val 
130 135 140 

Leu Ala Asp Phe Gly Val Thr Leu Pro Glu Gly Gin Arg He Arg Val 
145 150 155 I 60 

Trp Asp Ser Thr Ala Glu Thr Arg Phe He Val He Pro Leu Arg Pro 

165 I 70 

Ala Gly Thr Glu Gly Trp Ser Glu Glu Gin Leu Ala Ala He Val Thr 



040067 AM 



180 



38 



185 190 



Arg Asp Ser Met He Gly Thr Gly Val Val Ser Ala Glu Ala Ser Arg 
195 200 205 



<210> 57 

<211> 696 

<212> DNA 

< 2 1 3 > Unknown 

<220> 

<223> Metagenome - alpha unit nitrile hydratase - M3aG10 
<220> 

<221> CDS 

<222> (1) . . (696) 

<223> 

atg°gat 5 cca acg agg cgt agt ttc ctg gcg tct acc gtt gcc ctg acc 

48 ' , 

Met Asp Pro Thr Arg Arg Ser Phe Leu Ala Ser Thr Val Ala Leu Thr 
15 10 15 

ggc ggc gca get ate ccc gat ctg get cat gcg gca gac cac gac cac 

Gly Gly Ala Ala He Pro Asp Leu Ala His Ala Ala Asp His Asp His 

20 25 30 

cag cat caa gat ttg ccg tec gat ctg gcg ctg egg gtg aag teg etc 
144 

Gin His Gin Asp Leu Pro Ser Asp Leu Ala Leu Arg Val Lys Ser Leu 
35 40 45 

gaa teg ctg ctt gtc gag aag ggg ctg gtg gag cga gca gcg etc gac 
192 

Glu Ser Leu Leu -Val Glu Lys Gly Leu Val Glu Arg Ala Ala Leu Asp 
50 55 60 

gcg ctg gtg gac acc tac gag cac aaa gtc ggg ccg cga aac gga gcg 

Ala Leu Val Asp Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala 
65 70 75 80 

cgc gtt gtc gcg egg gcc tgg gtt gac ccg gac tac aag caa egg tta 

2 88 

toe Val Val Ala Arg Ala Trp Val Asp Pro Asp Tyr Lys Gin Arg Leu 

85 9° 95 

ttc gcg aac ggt acc gcc gca gtc gcg gag ttc ggc tac tec ggc teg 

Pte Ala Asn Gly Thr Ala Ala Val Ala Glu Phe Gly Tyr Ser Gly Ser 

100 I 05 110 

cag ggc get gac ate egg gtc gtc gaa aac acg gcc act gta cat aac 

3 84 

Gin Gly Ala Asp He Arg Val Val Glu Asn Thr Ala Thr Val His Asn 



040067 AM 



39 



115 120 125 

etc gtc gtg tgc acg ctg tgc tct tgt tat ccc tgg ccg gtg ctg ggc 

432 . _ n 

Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly 

130 135 I 40 

ttg ccg ccg gtc tgg tac aag tec gcg ccc tat egg tct cgc gtg gtg 

Leu Pro Pro Val Trp Tyr Lys Ser Ala Pro Tyr Arg Ser Arg Val Val 
145 150 . 155 160 

ate gat ccg cga ggt gtg ctg cgc gag ttc ggc gtg gtg ctg ccg gac 
528 

He Asp Pro Arg Gly Val Leu Arg Glu Phe Gly Val Val Leu Pro Asp 

165 170 175 

cat ate gaa gtg cgt gtc tat gac age acg gcg gag caa cgc tat eta 

His He Glu Val Arg Val Tyr Asp Ser Thr Ala Glu Gin Arg Tyr Leu 

180 185 190 

gtg ctg ccg gag egg ccg gee gga acc gaa aac ctg aca gaa gaa gcg 
624 

Val Leu Pro Glu Arg Pro Ala Gly Thr Glu Asn Leu Thr Glu Glu Ala 
195 200 205 

ctg gcg ctg ctg gtg acg cgc gac gcg atg att ggc gtg gec aag gtc 
672 

Leu Ala Leu Leu Val Thr Arg Asp Ala Met He Gly Val Ala Lys Val 



210 



215 220 



gcg ccg ccg gga ggc cgc gga tga 
696 

Ala Pro Pro Gly Gly Arg Gly 
225 230 



<210> 58 

<211> 231 

<212> PRT 

<213> Unknown 



<223> Metagenome - alpha unit nitrile hydratase - M3aG10 
<4.00> 5 8 

Met Asp Pro Thr Arg Arg Ser Phe Leu Ala Ser Thr Val Ala Leu Thr 

1 5 - 10 .15 

Gly Gly Ala Ala He Pro Asp Leu Ala His Ala Ala Asp His Asp His 

~ 25 



20 



Gin His Gin Asp Leu Pro, Ser Asp Leu Ala Leu Arg Val Lys Ser Leu 



35 



40 



040067 AM 



40 



Glu Ser Leu Leu Val Glu Lys Gly Leu Val Glu Arg Ala Ala Leu Asp 
50 55 60 

Ala Leu Val Asp Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala 
65 70 75 80 

Arg Val Val Ala Arg Ala Trp Val Asp Pro Asp Tyr Lys Gin Arg Leu 

85 90 95 

Phe Ala Asn Gly Thr Ala Ala Val Ala Glu Phe Gly Tyr Ser Gly Ser 

100 105 HO 

Gin Gly Ala Asp He Arg Val Val Glu Asn Thr Ala Thr Val His Asn 
115 120 125 

Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly 
130 135 I 40 

Leu Pro Pro Val Trp Tyr Lys Ser Ala Pro Tyr Arg Ser Arg Val Val 
145 150 155 160 

He Asp Pro Arg Gly Val Leu Arg Glu Phe Gly Val Val Leu Pro Asp 

165 170 175 

His He Glu Val Arg Val Tyr Asp Ser Thr. Ala Glu Gin Arg Tyr Leu 

180 185 190 

Val Leu Pro Glu Arg Pro Ala Gly Thr Glu Asn Leu Thr Glu Glu Ala 
195 200 205 

Leu Ala Leu Leu Val Thr Arg Asp Ala Met He Gly Val Ala Lys Val 
210 215 220 



Ala Pro Pro Gly Gly Arg Gly 
225 230 



<210> 59 

<211> 609 

<212> DNA 

<213> Unknown 

<223> Metagenome - alpha unit nitrile hydratase - M73dC9 



<220> 
<221> 



CDS 



040067 AM 



<222> (1) . . (609 
<223> 

<400> 59 

atg age teg aag 

48 

Met Ser Ser Lys 
1 

tac tac cag atg 
96 

Tyr Tyr Gin Met 

20 

ggc gtg ate ace 
144 

Gly Val He Thr 
35 

gcg aga age ccg 
192 

Ala Arg Ser Pro 
50 

gac ccg gcg tac 
240 

Asp Pro Ala Tyr 
65 

gag gag etc ggg 
288 

Glu Glu Leu Gly 



aac acc gcg gac 
336 

Asn Thr Ala Asp 

100 

tac ccg cgc ate 
384 

Tyr Pro Arg He 
115 

age tac cgc age 
432 

Ser Tyr Arg Ser 
130 

ttc ggc acg acc 
480 

Phe Gly Thr Thr 
145 

act gcg gac atg 
528 

Thr Ala Asp Met 



) 

ccc acc gaa gat 

Pro Thr Glu Asp 
5 

atg gaa gtg age 
Met Glu Val Ser 

gaa gcg gaa gtc 

Glu Ala Glu Val 

40 

gag cgc ggc gcg 

Glu Arg Gly Ala 
55 

aag gcg cgc atg 

Lys Ala Arg Met 
70 

ttc gag gtg ccg 

Phe Glu Val Pro 
85 

acg cac aac gtg 
Thr His Asn Val 

ctg etc ggc ate 

Leu Leu Gly He 

120 

cgc aca gtg cgc 

Arg Thr Val Arg 
135 

ate ccg gag aac 

He Pro Glu Asn 
150 

cgc tac etc gtg 

Arg Tyr Leu Val 
165 



41 



etc ggc acc tac 

Leu Gly Thr Tyr 
10 * 

ctg cgc gag ctg 

Leu Arg Glu Leu 
25 

gee cgc gcg atg 
Ala Arg Ala Met 

aag atg gtc gcg 

Lys Met Val Ala 

60 

ctt gee gac ggc 

Leu Ala Asp Gly 
75 

ggc etc aag ctg 

Gly Leu Lys Leu 
90 

gtc gtg tgc aeg 

Val Val Cys Thr 
105 

ccg ccc gag tgg 
Pro Pro Glu Trp 

gag ccg cgc gcg 

Glu Pro Arg Ala 

140 

gtc gcg ate cga 

Val Ala He Arg 
155 

atg ccg atg egg 

Met Pro Met Arg 
170 



cag ccg etc acc 

Gin Pro Leu Thr 
15 

ctg gtg gag aag 

Leu Val Glu Lys 
30 

ggc gag ate ggc 

Gly Glu He Gly 
45 

cgc gcg tgg gtg 
Arg Ala Trp Val 

age aag gee gee 

Ser Lys Ala Ala 

80 

ate gtg gtc gag 

He Val Val Glu 
95 

ctg tgc teg tgc 

Leu Cys Ser Cys 
110 

tac aag teg cgc 

Tyr Lys Ser Arg 

125 

gtg etc gee gaa 
Val Leu Ala Glu 

gtg cac gac age 

Val His Asp Ser 

160 

cct gcg ggc acc 

Pro Ala Gly Thr 
175 



040067 AM 



42 



gaa aat ttc acc gaa gag cag etc get gca ttg gtg acg cgc gac age 
57 6 

Glu Asn Phe Thr Glu Glu Gin Leu Ala Ala Leu Val Thr Arg Asp Ser 

180 185 190 

ctg ate ggt gtt tec tta gca acg ctt ccg tag 
609 

Leu lie Gly Val Ser Leu Ala Thr Leu Pro 
195 200 



<210> 60 

<211> 202 

<212> PRT 

< 2 1 3 > Unknown 

<220> 

<223> Metagenome - alpha unit nitrile hyclratase - M73dC9 
<400> 60 

Met Ser Ser Lys Pro Thr Glu Asp Leu Gly Thr Tyr Gin Pro Leu Thr 
15 10 15 

Tyr Tyr Gin Met Met Glu Val Ser Leu Arg Glu Leu Leu Val Glu Lys 

20 25 30 

Gly Val He Thr Glu Ala Glu Val Ala Arg Ala Met Gly Glu He Gly 
35 40 45 

Ala Arg Ser Pro Glu Arg Gly Ala Lys Met Val Ala Arg Ala Trp Val 
50 55 60 

Asp Pro Ala Tyr Lys Ala Arg Met Leu Ala Asp Gly Ser Lys Ala Ala 
65 70 75 80 

Glu Glu Leu Gly Phe Glu Val Pro Gly Leu Lys Leu He Val Val Glu 

85 90 95 

Asn Thr Ala Asp Thr His Asn Val Val Val Cys Thr Leu Cys Ser Cys 

100 105 HO 

Tyr Pro Arg He Leu Leu Gly He Pro Pro Glu Trp Tyr Lys Ser Arg 
115 120 125 

Ser Tyr Arg Ser Arg Thr Val Arg Glu Pro Arg Ala Val Leu Ala Glu 
130 135 140 

Phe Glv Thr Thr He Pro Glu Asn Val Ala He Arg Val His Asp Ser 
145 150 155 160 



040067 AM 



43 



Thr Ala Asp Met Arg Tyr Leu Val Met Pro Met Arg Pro Ala Gly Thr 

165 170 175 

Glu Asn Phe Thr Glu Glu Gin Leu Ala Ala Leu Val Thr Arg Asp Ser 

180 185 190 



Leu lie Gly Val Ser Leu Ala Thr Leu Pro 
195 200 



<210> 61 

<211> 825 

<212> DNA 

<213> Unknown 

<220> 

<223> Metagenome - beta unit nitrile hydratase 

<220> 

<221> CDS 

<222> (1) • . (825) 

<223> 

<400> 61 _ , . 

atg gtg gga cgt ggg aag tgg gca ctt ggc agt agg cag ttt get gcg 

Met Val Gly Arg Gly Lys Trp Ala Leu Gly Ser Arg Gin Phe Ala Ala 
1 5 10 

get gec aac tgg caa ctt ate agt cgc cct tea tgg tea get tgt aat 

IL Ala Asn Trp Gin Leu He Ser Arg Pro Ser Trp Ser Ala Cys Asn 

20 25 30 

ata ttg gtc etc atg age gee acg cac ccc aaa aag cgc gec gec gac 

lit Leu Val Leu Met Ser Ala Thr His Pro Lys Lys Arg Ala Ala Asp 
35 40 45 

ate ggc ggc aac aaa gee ggc gcg gtg gac ace gcg gat cac ggc atg 

lie Gly Gly Asn Lys Ala Gly Ala Val Asp Thr Ala Asp His Gly Met 

50 55 60 

aag ttc tgg gag egg cag gee aac gec ctg cgc ace gcg ctg egg cgc 

Lys Phe Trp Glu Arg Gin Ala Asn Ala Leu Arg Thr Ala Leu Arg Arg 
65 70 75 

aat gga ctg atg age gta gat gag ctg cgc cgc gca gcg gag gac ctg 
Asn Gly Leu Met Ser Val Asp Glu Leu Arg Arg Ala Ala Glu Asp Leu 



85 



040067 AM 



gga gac cgc tac 
336 

Gly Asp Arg Tyr 

100 

ctg cgc acg gtc 
384 

Leu Arg Thr Val 
115 

gcg gcg aag atg 
432 

Ala Ala Lys Met 
130 

gaa gga att gcc 
480 

Glu Gly He Ala 
145 

ggc aag cag gac 
528 

Gly Lys Gin Asp 



ggg cac cga ttc 
576 

Gly His Arg Phe 

180 

ccg ccc ggc cac 
624 

Pro Pro Gly His 
195 

gtg ate gag cgc 
672 

Val He Glu Arg 
210 

tac gga ttc gac 
720 

Tyr Gly Phe Asp 
225 

egg caa aaa gag 
768 

Arg Gin Lys Glu 



ate gag atg gag 
816 

He Glu Met Glu 

260 

aaa acc tga 
825 

Lys Thr 



gcg aag ctt gag 
Ala Lys Leu Glu 

ctg etc gaa aag 

Leu Leu Glu Lys 

120 

gcc gag gtg egg 

Ala Glu Val Arg 
135 

ggt gaa gaa gaa 

Gly Glu Glu Glu 
150 

ggc caa egg ctg 

Gly Gin Arg Leu 
165 

gat gtc ggt gac 
Asp Val Gly Asp 

cgc cgc acg cct 

Arg Arg Thr Pro 

200 

ate tgc ggc gcc 

He Cys Gly Ala 
215 

ggc gaa ccg aag 

Gly Glu Pro Lys 
230 

gtg tgg ccg gcc 

Val Trp Pro Ala 
245 

att ttc gag cat 
He Phe Glu His 



44 

tac ttc gag cgc 

Tyr Phe Glu Arg 
105 

ggc tac ttc acg 
Gly Tyr Phe Thr 

aag ccg ctt cga 

Lys Pro Leu Arg 

140 

agt gaa gcg atg 

Ser Glu Ala Met 
155 

cca tct acg tat 

Pro Ser Thr Tyr 
170 

cgc gtt gtg gtc 

Arg Val Val Val 
185 

cat tac ate cgc 
His Tyr He Arg 

ttc ccc aac ccg 

Phe Pro Asn Pro 

220 

aag gtg etc tac 

Lys Val Leu Tyr 
235 

tat cgc ggc ccg 

Tyr Arg Gly Pro 
250 

tgg etc gag ccg 

Trp Leu Glu Pro 
265 



acg acg ttc gcg 

Thr Thr Phe Ala 
110 

gag gag teg etc 

Glu Glu Ser Leu 
125 

tgt gcc gcg caa 
Cys Ala Ala Gin 

aac cca gcg acg 

Asn Pro Ala Thr 

160 

acc gcg gcg ccc 

Thr Ala Ala Pro 
175 

aag cgc tea aat 

Lys Arg Ser Asn 
190 

ggc aag acg ggc 

Gly Lys Thr Gly 
205 

gaa gag ctg gca 
Glu Glu Leu Ala 

cgc gtg cga ttc 

Arg Val Arg Phe 

240 

gcg cac gac gtg 

Ala His Asp Val 
255 

gcg cag age cag 

Ala Gin Ser Gin 
270 



040067 AM 



45 



<210> 


62 




<211> 


274 




<212> 


PRT 




<213> 


Unknown 




<220> 






<223> 


Metagenome - beta 


unit nitrile hydratase 


<400> 


62 




Met Val Gly Arg Gly Lys 


Trp Ala Leu Gly Ser Arg 


1 


5 


10 


Ala Ala Asn Trp Gin Leu 


lie Ser Arg Pro Ser Trp 




20 


25 



15 



30 



lie Leu Val Leu Met Ser Ala Thr His Pro Lys Lys Arg Ala Ala Asp 
35 40 45 

He Gly Gly Asn Lys Ala Gly Ala Val Asp Thr Ala Asp His Gly Met 
50 55 60 

Lys Phe Trp Glu Arg Gin Ala Asn Ala Leu Arg Thr Ala Leu Arg Arg 
65 70 75 80 

Asn Glv Leu Met Ser Val Asp Glu Leu Arg Arg Ala Ala Glu Asp Leu 

85 90 95 

Gly Asp Arg Tyr Ala Lys Leu Glu Tyr Phe Glu Arg Thr Thr Phe Ala 

100 1° 5 110 

Leu Arg Thr Val Leu Leu Glu Lys Gly Tyr Phe Thr Glu Glu Ser Leu 
115 120 125 

Ala Ala Lys Met Ala Glu Val Arg Lys Pro Leu Arg Cys Ala Ala Gin 
130 135 140 

Glu Gly He Ala Gly Glu Glu Glu Ser Glu Ala Met Asn Pro Ala Thr 
145 150 155 160 

Gly Lys Gin Asp Gly Gin Arg Leu Pro Ser Thr Tyr Thr Ala Ala Pro 

165 170 175 

Gly His Arg Phe Asp Val Gly Asp Arg Val Val Val Lys Arg Ser Asn 

180 I 85 190 



040067 AM 



46 



Pro Pro Gly His Arg Arg Thr Pro His Tyr He Arg Gly Lys Thr Gly 
195 200 205 

Val He Glu Arg He Cys Gly Ala Phe Pro Asn Pro Glu Glu Leu Ala 
210 215 220 

Tv r Gly Phe Asp Gly Glu Pro Lys Lys Val Leu Tyr Arg Val Arg Phe 
225 230 235 240 

Arg Gin Lys Glu Val Trp Pro Ala Tyr Arg Gly Pro Ala His Asp Val 

245 250 255 

He Glu Met Glu He Phe Glu His Trp Leu Glu Pro Ala Gin Ser Gin 

260 265 270 



Lys Thr 



<210> 63 

<211> 627 

<212> DNA • 

<213> Unknown 

<22 0> 

<223> Metagenome - beta unit nitrile hydratase - M12K24 
<220> 

<221> CDS 

<222> (1) . • (627) 

<223> 

<400> 63 . . 

atg gac ggc atg cac gac ctg gga ggc agg cag ggc ttc gga ccg gtt 

Met Asp Gly Met His Asp Leu Gly Gly Arg Gin Gly Phe Gly Pro Val 
1 5 10 15 

cgc tac acg ate gac gcg ccc gca ttc cat teg ccg tgg gaa gtg cgc 

Irg Tyr Thr He Asp Ala Pro Ala Phe His Ser Pro Trp Glu Val Arg 

20 25 30 

gcg aat teg etc tat gcg ttc gcg gtg cgc etc ggc ate ttc aac atg 
144 

Ala Asn Ser Leu Tyr Ala Phe Ala Val Arg Leu Gly He Phe Asn Met 
35 40 45 

gac gaa tac cgc cat gcg ate gag egg atg gag ccg cgc cat tac etc 
192 

Asp Glu Tyr Arg His Ala He Glu Arg Met Glu Pro Arg His Tyr Leu 
50 " 55 60 



040067 AM 
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ggc gcc ggc tat tac gaa cgc teg ttg acc ggc etc gcg acc ttg ctg 
240 

Gly Ala Gly Tyr Tyr Glu Arg Ser Leu Thr Gly Leu Ala Thr Leu Leu 
65 70 75 80 

gtc gag aag ggc gtc gtg acg cgc gag gaa etc gag acc egg gcg cag 
2 88 

Val Glu Lys Gly Val Val Thr Arg Glu Glu Leu Glu Thr Arg Ala Gin 

85 90 95 

ggc cgc tac ccg ctg gcg atg ccc age gcg cct ggc cgc acc aat gcg 
33 6 

Gly Arg Tyr Pro Leu Ala Met Pro Ser Ala Pro Gly Arg Thr Asn Ala 

100 1° 5 110 

cag gca cgc gag cgt ttc cag ccg ggc gac egg gtt cgc gtc aag gcg 

384 . ... 

Gin Ala Arg Glu Arg Phe Gin Pro Gly Asp Arg Val Arg Val Lys Ala 
115 120 125 

gat ttc gtg teg ggg cac gtg egg atg ccg gcg tac ate cgc ggc aag 

432 _ n _ 

Asp Phe Val Ser Gly His Val Arg Met Pro Ala Tyr He Arg Gly Lys 
130 135 140 

acc ggc gtg gtc gtc age gag tec ccg gac tat ccg ttt ccc gat gcg 

Thr Gly Val Val Val Ser Glu Ser Pro Asp Tyr Pro Phe Pro Asp Ala 
145 150 155 160 

cat gcg cac teg gtc gat gcc cag gac gag cca acc tac gac gtg cgc 

His Ala His Ser Val Asp Ala Gin Asp Glu Pro Thr Tyr Asp Val Arg 

165 170 175 

ttc cgc age gag gat eta tgg ccg gat tec gcc gat tec gca etc gtt 
57 6 

Phe Arg Ser Glu Asp Leu Trp Pro Asp Ser Ala Asp Ser Ala Leu Val 

180 185 190 

cac gtc ggc gta ttc cag age tac etc gag egg gag teg acg cca gga 
624 

His Val Gly Val Phe Gin Ser Tyr Leu Glu Arg Glu Ser Thr Pro Gly 

195 200 205 



tag 
627 



<210> 64 

<211> 208 

<212> PRT 

<213> Unknown 



<223> Metagenome - beta unit nitrile hydratase - M12K24 
<400> 64 
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Met Asp Gly Met His Asp Leu Gly Gly Arg Gin Gly Phe Gly Pro Val 
1 5 10 15 

Arg Tyr Thr lie Asp Ala Pro Ala Phe His Ser Pro Trp Glu Val Arg 

20 25 30 

Ala Asn Ser Leu Tyr Ala Phe Ala Val Arg Leu Gly He Phe Asn Met 
35 40 45 

Asp Glu Tyr Arg His Ala He Glu Arg Met Glu Pro Arg His Tyr Leu 
50 55 60 

Gly Ala Gly Tyr Tyr Glu Arg Ser Leu Thr Gly Leu Ala Thr Leu Leu 
65 70 75 80 

Val Glu Lys Gly Val Val Thr Arg Glu Glu Leu Glu Thr Arg Ala Gin 

85 90 95 

Gly Arg Tyr Pro Leu Ala Met Pro Ser Ala Pro Gly Arg Thr Asn Ala 

100 105 HO 

Gin Ala Arg Glu Arg Phe Gin Pro Gly Asp Arg Val Arg Val Lys Ala 
115 120 125 

Asp Phe Val Ser Gly His Val Arg Met Pro Ala Tyr He Arg Gly Lys 
130 135 140 

Thr Gly Val Val Val Ser Glu Ser Pro Asp Tyr Pro Phe Pro Asp Ala 
145 150 155 160 

His Ala His Ser Val Asp Ala Gin Asp Glu Pro Thr Tyr Asp Val Arg 

165 170 175 

Phe Arg Ser Glu Asp Leu Trp Pro Asp Ser Ala Asp Ser Ala Leu Val 

180 185 190 

His Val Gly Val Phe Gin Ser Tyr Leu Glu Arg Glu Ser Thr Pro Gly 
195 200 205 



<210> 65 

<211> 660 

<212> DNA 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M29M24 



040067 AM 



49 



<220> 

<221> CDS 

<222> (1) . . (660) 

<223> 

Itg°aac 6 ggc gtt cat gac atg ggc ggc atg cac ggc atg ggt gcg ate 
48 

Met Asn Gly Val His Asp Met Gly Gly Met His Gly Met Gly Ala He 
1 5 10 

cgc cgc gag gag aac gag ccc get ttc cac gag ccc tgg gag ggg egg 

Are Arg Glu Glu Asn Glu Pro Ala Phe His Glu Pro Trp Glu Gly Arg 

20 25 30 

gtt ttc get ctg acc acg gcg gtc gag gec tgg ggt egg tgg ace etc 
144 

Val Phe Ala Leu Thr Thr Ala Val Glu Ala Trp Gly Arg Trp Thr Leu 
35 40 45 

gat get tec cga cac egg ate gag egg atg aat gcg gcg gac tat ctg 
192 

Asp Ala Ser Arg His Arg He Glu Arg Met Asn Ala Ala Asp Tyr Leu 
50 55 60 

egg gtg age tat tac gag aag tgg etc gag teg ctt etc get etc ctg 

Arg Val Ser Tyr Tyr Glu Lys Trp Leu Glu Ser Leu Leu Ala Leu Leu 
65 70 

tec gag acc gga atg gcg agt ccg gcg gag ata egg agt ggg gag cgt 

2 88 

Ser Glu Thr Gly Met Ala Ser Pro Ala Glu He Arg Ser Gly Glu Arg 

85 90 , 95 

gec gac ggc aca ccg aaa gcg acc ccg ccg etc ccg gec gac cac gtg 

Ala Asp Gly Thr Pro Lys Ala Thr Pro Pro Leu Pro Ala Asp His Val 

100 105 HO 

acg gcg att etc gec age ggg ttt ccc gcg age egg gag gcg gga get 

Thr Ala He Leu Ala Ser Gly Phe Pro Ala Ser Arg Glu Ala Gly Ala 
115 120 125 

geg cct cgc ttc cga gtg age gag egg gtg cgc acc egg aac ate aac 

Ala Pro Arg Phe Arg Val Ser Glu Arg Val Arg Thr Arg Asn He Asn 
130 135 I 40 

ccg acg act cac acg cgc ctt ccg cga tac gee egg egg aag etc ggg 

Pro Thr Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Arg Lys Leu Gly 
145 150 I 55 

, „t-rr n-c ate ttc ccg gat acg aac gcg 

acg ate gag cgc gac cac gga gtg ccc gtc toe ^ a » 

528 
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50 



Thr He Glu Arg Asp His Gly Val Phe Val Phe Pro Asp Thr Asn Ala 

165 170 175 

cac get etc ggg gag aaa ccg cag cac gtc tat teg gtt cgt ttc gag 
B V 6 

His Ala Leu Gly Glu Lys Pro Gin His Val Tyr Ser Val Arg Phe Glu 

180 185 190 

gcg cgt gag etc tgg ggc gag act gee agg cca gag gat tec gtc tac 
624 

Ala Arg Glu Leu Trp Gly Glu Thr Ala Arg Pro Glu Asp Ser Val Tyr 

195 200 205 

ate gat ctt tgg gac gag tac ctt gaa ccc gtg tag 
660 

He Asp Leu Trp Asp Glu Tyr Leu Glu Pro Val 
210 . 215 



<210> 66 

<211> 219 

<212> PRT 

< 2 1 3 > Unknown 

<220> „„ 

<223> Metagenome - beta unit nitrile hydratase - M29M24 

<400> 66 

Met Asn Gly Val His Asp Met Gly Gly Met His Gly Met Gly Ala He 

tr 10 I 5 



Ara Ara Glu Glu Asn Glu Pro Ala Phe His Glu Pro Trp Glu Gly Arg 

20 25 30 

Val Phe Ala Leu Thr Thr Ala Val Glu Ala Trp Gly Arg Trp Thr Leu 
35 40 45 

Asp Ala Ser Arg His Arg lie Glu Arg Met Asn Ala Ala Asp Tyr Leu 
50 55 60 

Arg Val Ser Tyr Tyr Glu Lys Trp Leu Glu Ser Leu Leu Ala Leu Leu 
65 70 75 

Ser Glu Thr Gly Met Ala Ser Pro Ala Glu He Arg Ser Gly Glu Arg 

85 90 95 

Ala Asp Gly Thr Pro Lys Ala Thr Pro Pro Leu Pro Ala Asp His Val 

100 1° 5 110 

Thr Ala He Leu Ala Ser Gly Phe Pro Ala Ser Arg Glu Ala Gly Ala 
115 120 125 
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Ala Pro Arg Phe Arg Val Ser Glu Arg Val Arg Thr Arg Asn lie Asn 
130 135 140 

Pro Thr Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Arg Lys Leu Gly 
145 150 155 160 

Thr He Glu Arg Asp His Gly Val Phe Val Phe Pro Asp Thr Asn Ala 

165 170 175 

His Ala Leu Gly Glu Lys Pro Gin His Val Tyr Ser Val Arg Phe Glu 

180 185 190 

Ala Arg Glu Leu Trp Gly Glu Thr Ala Arg Pro Glu Asp Ser Val Tyr 
195 200 205 

He Asp Leu Trp Asp Glu Tyr Leu Glu Pro Val 
210 215 



<210> 


67 


<211> 


660 


<212> 


DNA 


<213> 


Unknown 


<220> 




<223> 


Metagenome - 


<220> 




<221> 


CDS 


<222> 


(1) . . (660) 


<223> 




<400> 


67 


atg acc aat teg ctg 


48 




Met Thr Asn Ser Leu 


1 


5 



10 15 
gtc gag ccc gag ccg aac gag ccg cog ttt cac cag cgc tgg gag ggc 

val Glu Pro Glu Pro Asn Glu Pro Pro Phe His Gin Arg Trp Glu Gly 

20 25 30 

egg gtg ctg ggg atg cag cgc gec atg ggc ttt acc ggg ctg tgg acc 

A rg Val Leu Gly Met Gin Arg Ala Met Gly Phe Thr Gly Leu Trp Thr 
35 40 45 

ate gac gec ggc cgc gec teg etc gaa gec ctg ccg cca tta gcg tat 
1 92 

He Asp Ala Gly Arg Ala Ser Leu Glu Ala Leu Pro Pro Leu Ala Tyr 
50 55 60 
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ctg ggt teg tec tac tat egg cgc tgg ttt ctt ggc ctg gag age egg 

240 _ 

Leu Gly Ser Ser Tyr Tyr Arg Arg Trp Phe Leu Gly Leu Glu Ser Arg 

65 70 75 80 

ctg ctg ctg cgc ggc etc gtt ggc gag gac gag ate gcg gca ggc cgt 
288 

Leu Leu Leu Arg Gly Leu Val Gly Glu Asp Glu lie Ala Ala Gly Arg 

85 90 95 

teg atg cgc gec ggc gec atg ttg ccg cgc acc ctg acc cag gec gat 
3 3 6 

Ser Met Arg Ala Gly Ala Met Leu Pro Arg Thr Leu Thr Gin Ala Asp 

100 105 110 

gtg gag aaa acc ctg acc cgc ggc gac ttc gec cgc ccg acc aac acc 
3 84 

Val Glu Lys Thr Leu Thr Arg Gly Asp Phe Ala Arg Pro Thr Asn Thr 
H5 120 125 

ccg gcg cgt ttc cag ccg ggc gac egg gtg caa acg aag aac ate aac 
432 

pro Ala Arg Phe Gin Pro Gly Asp Arg Val Gin Thr Lys Asn lie Asn 
130 135 140 

ccg gcg acc cac acc cgc ctg ccg cgc tat gec cgc ggc aag act ggc 

Pro Ala Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Gly Lys Thr Gly 
145 150 155 160 

acg gtc gag gcg gtc cgc ggc gtt cac gtc ttt ccc gac acc gec gcg 
52 8 

Thr Val Glu Ala Val Arg Gly Val His Val Phe Pro Asp Thr Ala Ala 

165 170 175 

etc ggc gec ggc gac gac ccg caa tgg etc tac gee gtg gtc ttc ccg 

Leu Gly Ala Gly Asp Asp Pro Gin Trp Leu Tyr Ala Val Val Phe Pro 

180 185 190 

gcg cgc gag ttg tgg gga gag gcg gee gat ccc gcg ate aaa ate teg 

Ala Arg Glu Leu Trp Gly Glu Ala Ala Asp Pro Ala lie Lys lie Ser 
!95 200 205 

ate gag gcg ttc gaa ccc tat ate gac ccc gca tga 

660 _ 
lie Glu Ala Phe Glu Pro Tyr He Asp Pro Ala 

210 215 



<210> 68 

<211> 219 

<212> PRT 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M2K17 
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<400> 68 

Met Thr Asn Ser Leu His Asp Met Gly Gly Met His Gly Phe Gly Arg 
1 5 10 15 

Val Glu Pro Glu Pro Asn Glu Pro Pro Phe His Gin Arg Trp Glu Gly 

20 25 30 

Arg Val Leu Gly Met Gin Arg Ala Met Gly Phe Thr Gly Leu Trp Thr 
35 40 45 

He Asp Ala Gly Arg Ala Ser Leu Glu Ala Leu Pro Pro Leu Ala Tyr 
50 55 60 

Leu Gly Ser Ser Tyr Tyr Arg Arg Trp Phe Leu Gly Leu Glu Ser Arg 
65 70 75 80 

Leu Leu Leu Arg Gly Leu Val Gly Glu Asp Glu He Ala Ala Gly Arg 

85 90 95 

Ser Met Arg Ala Gly Ala Met Leu Pro Arg Thr Leu Thr Gin Ala Asp 

100 105 11° 

Val Glu Lys Thr Leu Thr Arg Gly Asp Phe Ala Arg Pro Thr Asn Thr 
115 120 125 

Pro Ala Arg Phe Gin Pro Gly Asp Arg Val Gin Thr Lys Asn He Asn 
130 135 140 

Pro Ala Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Gly Lys Thr Gly 
145 150 155 I 60 



Thr Val Glu Ala Val Arg Gly Val His Val Phe Pro Asp Thr Ala Ala 

165 



170 115 



Leu Gly Ala Gly Asp Asp Pro Gin Trp Leu Tyr Ala Val Val Phe Pro 

180 185 I 90 

Ala Arg Glu Leu Trp Gly Glu Ala Ala Asp Pro Ala lie Lys He Ser 
195 200 205 

He Glu Ala Phe Glu Pro Tyr He Asp Pro Ala 
210 215 
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<210> 69 

<211> 663 

<212> DNA 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M23dAl2 
<220> 

<221> CDS 

<222> (1) . . (663) 

<223> 

itg°gac 6 ggc gtg cac gac atg ggc ggc atg cac ggt ttc ggc aag gtc 

Met Asp Gly Val His Asp Met Gly Gly Met His Gly Phe Gly Lys Val 
1 • 5 10 lb 

gag - ccg gaa gcg aac gag ccc gcc ttc cat gcg gaa tgg gaa ggc cgc 

Glu Pro Glu Ala Asn Glu Pro Ala Phe His Ala Glu Trp Glu Gly Arg 

20 25 30 

tgc etc gcg etc aac cgc gcc atg ggt gcg ate ggc gcc tgg ace ate 

lit Leu Ala Leu Asn Arg Ala Met Gly Ala He Gly Ala Trp Thr He 
35 40 45 

gat gaa ggc cgt gcc ggc ate gag ate ctg ccg ccg gag att tat ctt 

Asp Glu Gly Arg Ala Gly He Glu He Leu Pro Pro Glu He Tyr Leu 
50 55 60 

ggc agt teg tac tat gga aaa tgg gcg egg egg ctg gag aat atg gtg 

Gxy Ser Ser Tyr Tyr Gly Lys Trp Ala Arg Arg Leu Glu Asn Met Val 
65 . 70 75 

gtc gca cgc ggg ttc gcg ggc gcc gat gaa etc gcc gcg ggt cgc gca 

S 8 1 Ala Arg Gly Phe Ala Gly Ala Asp Glu Leu Ala Ala Gly Arg Ala 

85 90 

gcg cgt ccc ggc aga teg gtg aaa cga aag ctt acg gtc gcc gaa gtg 

Ala Arg Pro Gly Arg Ser Val Lys Arg Lys Leu Thr Val Ala Glu Val 

100 105 

ccg cgc acg ctg acg cgc ggt tea ttt ttc cgc gag gca aca aag ccg 

Pro Arg Thr Leu Thr Arg Gly Ser Phe Phe Arg Glu Ala Thr Lys Pro 

115 120 125 

gca cga ttt gcg gtc ggc gaa cgc gtg cgc ace agg aac att cat ccg 

Ala Arg Phe Ala Val Gly Glu Arg Val Arg Thr Arg Asn He His Pro 

Tin 135 140 

130 ±3D 
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gcg acg cac act egg ttg ccg cga tat gcg cgc ggc cat gtc ggc gtg 

Ala Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Gly His Val Gly Val 
145 150 155 160 

ate gag gcg ate cgc ggt tgc cac.gta ttt ccc gac teg gtt gcg ate 

lie Glu Ala He Arg Gly Cys His Val Phe Pro Asp Ser Val Ala He 

165 l" 70 

ggc gec ggc gag aac ccg caa tgg ctt tat acg gtg gtg ttc gaa ggc 
57 6 

Gly Ala Gly Glu Asn Pro Gin Trp Leu Tyr Thr Val Val Phe Glu Gly 

180 185 19° 

cgc acg ctg tgg ggc gat age gee gat ccg acg ctt aag gtc teg ate 

Arg Thr Leu Trp Gly Asp Ser Ala Asp Pro Thr Leu Lys Val Ser He 
195 200 205 

gag gcg ttc gag ccg tat ctg gaa ccg gee caa cca tga 
663 

Glu Ala Phe Glu Pro Tyr Leu Glu Pro Ala Gin Pro 
210 215 220 



<210> 70 
<211> 220 
<212> • PRT 
<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M23dAl2 
<400> 70 

Met Asp Gly Val His Asp Met Gly Gly Met His Gly Phe Gly Lys Val 
1 5 1° 

Glu Pro Glu Ala Asn Glu Pro Ala Phe His Ala Glu Trp Glu Gly Arg 

20 25 30 

C ys Leu Ala Leu Asn Arg Ala Met Gly Ala He Gly Ala Trp Thr He 
35 40 45 

Asp Glu Gly Arg Ala Gly He Glu He Leu Pro Pro Glu He Tyr Leu 
50 55 60 

Gly Ser Ser Tyr Tyr Gly Lys Trp Ala Arg Arg Leu Glu Asn Met Val 

70 1 - 



65 



Val Ala Arg Gly Phe Ala Gly Ala Asp Glu Leu Ala Ala Gly Arg Ala 

85 90 9 5 
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Ala Arg Pro Gly Arg Ser Val Lys Arg Lys Leu Thr Val Ala Glu Val 

100 105 HO 

Pro Arg Thr Leu Thr Arg Gly Ser Phe Phe Arg Glu Ala Thr Lys Pro 
115 120 125 

Ala Arg Phe Ala Val Gly Glu Arg Val Arg Thr Arg Asn He His Pro 
130 135 140 

Ala Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Gly His Val Gly Val 
145 150 155 160 

He Glu Ala He Arg Gly Cys His Val Phe Pro Asp Ser Val Ala He 

165 170 175 

Glv Ala Gly Glu Asn Pro Gin Trp Leu Tyr Thr Val Val Phe Glu Gly 

180 185 190 

Arg Thr Leu Trp Gly Asp Ser Ala Asp Pro Thr Leu Lys Val Ser He 
195 200 205 

Glu Ala Phe Glu Pro Tyr Leu Glu Pro Ala Gin Pro 
210 215 220 



<210> 71 

<211> 888 

<212> DNA 

<213> Unknown 

<22 0> 

<223> Metagenome - beta unit nitrile hydratase - M49bD9 
<220> 

<221> CDS 

<222> (1) . . (888) 

<223> 

itg°aac 7 ggc gta cac gat ctt ggc ggg atg gat ggt ttc ggc egg gtg 

Met Asn Gly Val His Asp Leu Gly Gly Met Asp Gly Phe Gly Arg Val 
15 1° 15 

atg gcg gag gcg gac gag cog gtc ttt cat gag ccc tgg gaa ggt cgc 

Met Ala Glu Ala Asp Glu Pro Val Phe His Glu Pro Trp Glu Gly Arg 

20 25 30 

gtg ttt gcg etc aac atg etc ggc ate ggg cgc gag ccc att ccg gtg 
144 
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Val Phe Ala Leu Asn Met Leu Gly He Gly Arg Glu Pro He Pro Val 
35 40 45 

gac gcg ctg cgc cat cgc att gag egg ate gag ccg tgg cgc tat ctg 
192 

Asp Ala Leu Arg His Arg He Glu Arg He Glu Pro Trp Arg Tyr Leu 
50 55 60 

acg teg age tat tac gaa cga tgg ctg gee gaa atg gag cag gec ate 

Thr Ser Ser Tyr Tyr Glu Arg Trp Leu Ala Glu Met Glu Gin Ala lie 
65 70 75 80 

ate gat gcg ggc acg ctg act cct ggt gaa ate gat gcg cga atg ggc 

lie asp Ala Gly Thr Leu Thr Pro Gly Glu He Asp Ala Arg Met Gly 

85 90 9 

gag etc gaa acg gat cct gat cgc cca ctg cca agg act gat aac cct 

Glu Leu Glu Thr Asp Pro Asp Arg Pro Leu Pro Arg Thr Asp Asn Pro 

100 IO 5 110 

gag cat gec gat ggg gtg gcg gcg gcg ttg cgc gec ggc agt ccc gta 

Glu His Ala Asp Gly Val Ala Ala Ala Leu Arg Ala Gly Ser Pro Val 
115 120 125 

acg cgc aag att cgc aag cag ccg cgc ttc aca ate ggc gat egg gtc 

Jnr Arg Lys He Arg Lys Gin Pro Arg Phe Thr He Gly Asp Arg Val 
130 135 140 

gta acg cgc aat ctt aat ccg cac ggc cat acg egg ctg ccg cgc tat 

Vax Thr Arg Asn Leu Asn Pro His Gly His Thr Arg Leu Pro Arg Tyr 
145 150 I 55 

gcg cgc ggc aag cgc ggc gtc gta acg ctg cac cat ggc gca cat gtc 

Ala Arg Gly Lys Arg Gly Val Val Thr Leu His His Gly Ala His Val 

165 I 70 

ttt ccg gat acg aac gcg cac ggg ctg ggc gag cat ccg cag cat etc 

III Pro Asp Thr Asn Ala His Gly Leu Gly Glu His Pro Gin His Leu 

180 185 I 90 

tat acg gtg cga ttt cct gcg cgc gag tta tgg age gac gcg gec gag 

Tyr Thr Val Arg Phe Pro Ala Arg Glu Leu Trp Ser Asp Ala Ala Glu 
195 200 205 

ccg aaa gaa teg ata atg ate gat ttg tgg gag age tat ctt caa ccc 

Pro Lys Glu Ser He Met He Asp Leu Trp Glu Ser Tyr Leu Gin Pro 
210 215 220 
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gat ate ggc age 
720 

Asp He Gly Ser 
225 

aaa gtt aag ccc 
768 

Lys Val Lys Pro 



gec aag gec aaa 
816 

Ala Lys Ala Lys 

260 

ctg aaa cct gcg 
864 

Leu Lys Pro Ala 
275 

get aag ega aag 
888 

Ala Lys Arg Lys 
290 



aaa gcg teg teg 

Lys Ala Ser Ser 
230 

gca atg gee aag 

Ala Met Ala Lys 
245 

act egg gga aag 
Thr Arg Gly Lys 

ega gcg gcg ace 

Arg Ala Ala Thr 

280 

gee aaa ega tga 

Ala Lys Arg 
295 



tec gcg aaa ggc 

Ser Ala Lys Gly 
235 

gca ace gee aag 

Ala Thr Ala Lys 
250 

gcg gcg ccg aag 

Ala Ala Pro Lys 
265 

tea gca gca tec 
Ser Ala Ala Ser 



aaa gcg acg ccg 

Lys Ala Thr Pro 

240 

gta age gtc teg 

Val Ser Val Ser 
255 

gag cgt cca aaa 

Glu Arg Pro Lys 
270 

ggc ggc gaa aaa 

Gly Gly Glu Lys 
285 



<210> 72 

<211> 295 

<212> PRT 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M49bD9 

<400> 72 

Met Asn Gly Val His Asp Leu Gly Gly Met Asp Gly Phe Gly Arg Val 
1 5 10 15 

Met Ala Glu Ala Asp Glu Pro Val Phe His Glu Pro Trp Glu Gly Arg 

20 25 30 

Val Phe Ala Leu Asn Met Leu Gly He Gly Arg Glu Pro He Pro Val 
35 ^O 45 

Asp Ala Leu Arg His Arg He Glu Arg He Glu Pro Trp Arg Tyr Leu 
50 55 60 

Thr Ser Ser Tyr Tyr Glu Arg Trp Leu Ala Glu Met Glu Gin Ala lie 
65 7 0 75 

He Asp Ala Gly Thr Leu Thr Pro Gly Glu He Asp Ala Arg Met Gly 

9 0 



85 
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Glu Leu Glu Thr Asp Pro Asp Arg Pro Leu Pro Arg Thr Asp Asn Pro 

100 105 11° 

5 Glu His Ala Asp Gly Val Ala Ala Ala Leu Arg Ala Gly Ser Pro Val 

115 120 125 

10 Thr Arg Lys He Arg Lys Gin Pro Arg Phe Thr lie Gly Asp Arg Val 

130 135 140 

Val Thr Arg Asn Leu Asn Pro His Gly His Thr Arg Leu Pro Arg Tyr 
15 145 150 I 55 lbU 

Ala Arg Gly Lys Arg Gly Val Val Thr Leu His His Gly Ala His Val 

165 110 

0 

Phe Pro Asp Thr Asn Ala His Gly Leu Gly Glu His Pro Gin His Leu 

180 I 85 190 



25 



30 



Tyr Thr Val Arg Phe Pro Ala Arg Glu Leu Trp Ser Asp Ala Ala Glu 
195 200 205 

Pro Lys Glu Ser He Met He Asp Leu Trp Glu Ser Tyr Leu Gin Pro 
210 215. 220 




Asp He Gly Ser Lys Ala Ser Ser Ser Ala Lys Gly Lys Ala Thr Pro 
35 225 230 235 

Lys Val Lys Pro Ala Met Ala Lys Ala Thr Ala Lys Val Ser Val Ser 



245 



250 



0 



Ala Lys Ala Lys Thr Arg Gly Lys Ala Ala Pro Lys Glu Arg Pro Lys 



260 265 



45 



Leu Lys Pro Ala Arg Ala Ala Thr Ser Ala Ala Ser Gly Gly Glu Lys 
275 280 



50 Ala Lys Arg Lys Ala Lys Arg 

290 295 



<210> 73 

55 <211> 630 

<212> DNA 

< 2 1 3 > Unknown 



<220^ 
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<223> Metagenome - beta unit nitrile hydratase - M6dE2 
<220> 

<221> CDS 

<222> (1) . . (630) 

<223> 

atg°gac 7 ggc att cat gat etc ggt ggg atg age ggg ttc ggt etc gtg 

Met Asp Gly He His Asp Leu Gly Gly Met Ser Gly Phe Gly Leu Val 
1 5 10 15 

gag ate gag ccc gat gag ccg gtg ttc cac gag ccc tgg gag gcg ctg 

Glu He Glu Pro Asp Glu Pro Val Phe His Glu Pro Trp Glu Ala Leu 

20 25 30 

gtt ttc get ctg atg act etc ggt ate ggg aag etc ggc gcg tac aac 

Vat Phe Ala Leu Met Thr Leu Gly He Gly Lys Leu Gly Ala Tyr Asn 
35 40 45 

g cc gat gag tac cgc cac teg ate gag egg atg gat ccg gee cac tac 

Ala Asp Glu Tyr Arg His Ser He Glu Arg Met Asp Pro Ala His Tyr 
50 55 60 

ctt gcg gcg acg tac tac gag cgc atg etc ace ggc gtc gca acg etc 

Leu Ala Ala Thr Tyr Tyr Glu Arg Met Leu Thr Gly Val Ala Thr Leu 
65 70 75 

etc gtc gag aag aac gtc gtt gcc cgc gac gag etc gaa gcg cgc gcc 

III val Glu Lys Asn Val Val Ala Arg Asp Glu Leu Glu Ala Arg Ala 

85 90 

ggc ggg ccc ttc ccg ctg tea egg ccg gtg gcc gag egg ccg acg gcg 

Gly Gly Pro Phe Pro Leu Ser Arg Pro Val Ala Glu Arg Pro Thr Ala 
Y 100 I 05 110 

gac ctt egg ccc cag cca caa cca cgc ttc gcg gtc ggg gat egg gtc 

Asp Leu Arg Pro Gin Pro Gin Pro Arg Phe Ala Val Gly Asp Arg Val 
115 I 20 125 

gtc gtg cgc gac ate cac ccg gcc ggg cat act cgt gtg ccg cgc tac 

Val Val Arg Asp He His Pro Ala Gly His Thr Arg Val Pro Arg Tyr 
130 135 140 

gtg egg ggc aag cgc ggg ace gtc gtg cac gtc gcg ccg aaa ttc teg 
vll Arg Gly Lys Arg Gly Thr Val Val His Val Ala Pro Lys Phe Ser 



145 150 



040067 AM 



61 



ttc ccc gac acg gcc gcg cac ggg ctg acc cat egg age gag cac acg 

Phe Pro Asp Thr Ala Ala His Gly Leu Thr His Arg Ser Glu His Thr 

165 170 175 

tat cac gtg gaa ttc gtc gcg agt gac ctt tgg gcc gac gtg gcc ggg 
57 6 

Tvr His Val Glu Phe Val Ala Ser Asp Leu Trp Ala Asp Val Ala Gly 

180 185 19° 

age aat gag age gta etc gtg gac ctg tgg gac ggc tat ctg gag ggc 

624 n 

Ser Asn Glu Ser Val Leu Val Asp Leu Trp Asp Gly Tyr Leu Glu Gly 
195 200 . 205 

gca tga 

630 

Ala 



<210> 74 

<211> 209 

<212> PRT 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M6dE2 

<400> 74 

Met Asp Gly He His Asp Leu Gly Gly Met Ser Gly Phe Gly Leu Val 
1 5 10 

u lie Glu Pro Asp Glu Pro Val Phe His Glu Pro Trp Glu Ala Leu 



Gl 

20 



25 30 



Val Phe Ala Leu Met Thr Leu Gly He Gly Lys Leu Gly Ala Tyr Asn 
35 40 45 



Ala Asp 
50 



Glu Tyr Arg His Ser He Glu Arg Met Asp Pro Ala His Tyr 



55 60 



Leu Ala Ala Thr Tyr Tyr Glu Arg Met Leu Thr Gly Val Ala Thr Leu 
65 70 75 

Leu Val Glu Lys Asn Val Val Ala Arg Asp Glu Leu Glu Ala Arg Ala 

85 90 

Gly Gly Pro Phe Pro Leu Ser Arg Pro Val Ala Glu Arg Pro Thr Ala 



100 



040067 AM 



62 

Asp Leu Arg Pro Gin Pro Gin Pro Arg Phe Ala Val Gly Asp Arg Val 
115 120 125 

Val Val Arg Asp He His Pro Ala Gly His Thr Arg Val Pro Arg Tyr 
130 135 140 

Val Arg Gly Lys Arg Gly Thr Val Val His Val Ala Pro Lys Phe Ser 
145 150 155 160 

Phe Pro Asp Thr Ala Ala His Gly Leu Thr His Arg Ser Glu His Thr 

165 170 175 

Tvr His Val Glu Phe Val Ala Ser Asp Leu Trp Ala Asp Val Ala Gly 

., ™ 1 ftR 190 



180 



Ser Asn Glu Ser Val Leu Val Asp Leu Trp Asp Gly Tyr Leu Glu Gly 
195 200 205 



Ala 



<210> 75 

<211> 651 

<212> DNA 

<213> Unknown 

<220> 

<223> Metagenome - beta unit nitrile hydratase - M2 5A18 
<220> 

<221> CDS 

<222> (1) . . (651) 

<223> 

Ug°cgc 7 ggc acg cac gat etc ggc gga ttg ccc gec ggc cog gtg gac 

Met Arg Gly Thr His Asp Leu Gly Gly Leu Pro Ala Gly Pro Val Asp 
1 5 1° 15 

acc get ccc cac gaa ccg acc ttc tgg gaa aag cag gtg gac gcg ate 

Thr Ala Pro His Glu Pro Thr Phe Trp Glu Lys Gin Val Asp Ala He 

20 25 30 

cac ggc ctg etc ggc gat tec aag cgc cgc ate acg ctg cgc gac gag 

His Gly Leu Leu Gly Asp Ser Lys Arg Arg He Thr Leu Arg Asp Glu 
35 ' 40 45 



aac cgc 
192 



etc tat ate gaa teg etc ggc gac gac gtc tac aac acg etc 



040067 AM 



63 

Asn Arg Leu Tyr lie Glu Ser Leu Gly Asp Asp Val Tyr Asn Thr Leu 
50 55 60 

ggc tat tac gag cgc tgg acc gcc gcc atg tgc cgc cag etc ate gac 

Gly Tyr Tyr Glu Arg Trp Thr Ala Ala Met Cys Arg Gin Leu lie Asp 
65 70 75 80 

aag ggc gtg ctg acg cag gac gag ate gac gcc aag ate gcc gag ctg 

Lys Gly Val Leu Thr Gin Asp Glu He Asp Ala Lys He Ala Glu Leu 

85 90 95 

cgc gcc cgc ggc gtc ggc gcg gga cga cga cga aac ggc ctg caa acc 

Arg Ala Arg Gly Val Gly Ala Gly Arg Arg Arg Asn Gly Leu Gin Thr 

100 105 HO 

gtg age gcc gat ctg gcc gcc gat ctg gcc ate gcg ccg cgc ttc gcc 

3 84 n -* n 

Val Ser Ala Asp Leu Ala Ala Asp Leu Ala He Ala Pro Arg Phe Ala 
115 120 125 

gcc ggc gac cgc gtg egg gtg cgc gac gat tat ccg ccc ggg cac ate 
432 

Ala Gly Asp Arg Val Arg Val Arg Asp Asp Tyr Pro Pro Gly His He 
130 135 l^O 

cgc acg ccg gtc tat gtg cgc ggc aag acg ggc gtg gtg acg cgc tgc 

Arg Thr Pro Val Tyr Val Arg Gly Lys Thr Gly Val Val Thr Arg Cys 
145 150 155 160 

ttc ggc gcg ttc aag aac ccg gaa ttg etc gcc ate ggc aag gac ggc 

528 ~ „ n 

Phe Gly Ala Phe Lys Asn Pro Glu Leu Leu Ala He Gly Lys Asp Gly 

165 l" 70 
ctg ccc aag aaa att etc tac gaa gtg cgc ttc aag cag acc gat etc 

III Pro Lys Lys He Leu Tyr Glu Val Arg Phe Lys Gin Thr Asp Leu 

180 I 85 I 90 

tgg ccc gac tat gcc ggg ccg gcg acc gat acg ctg ctg ate gac ate 

6 24 _ 
Trp Pro Asp Tyr Ala Gly Pro Ala Thr Asp Thr Leu Leu lie Asp He 
195 200 205 

tac gaa cat tgg ctg age gac gcg tga 
651 

Tyr Glu His Trp Leu Ser Asp Ala 
210 215 



<210> 76 

<211> 216 

<212> PRT 

<213> Unknown 



040067 AM 



64 



<220> 

<223> Metagenome - beta unit nitrile hydratase - M25A18 
<400> 76 

Met Arg Gly Thr His Asp Leu Gly Gly Leu Pro Ala Gly Pro Val Asp 
1 5 10 15 

Thr Ala Pro His Glu Pro Thr Phe Trp Glu Lys Gin Val Asp Ala lie 

20 25 30 

His Gly Leu Leu Gly Asp Ser Lys Arg Arg lie Thr Leu Arg Asp Glu 
35 40 45 

Asn Arg Leu Tyr lie Glu Ser Leu Gly Asp Asp Val Tyr Asn Thr Leu 
50 55 60 

Gly Tyr Tyr Glu Arg Trp Thr Ala Ala Met Cys Arg Gin Leu lie Asp 
65 70 75 BU 

Lys Gly Val Leu Thr Gin Asp Glu He Asp Ala Lys He Ala Glu Leu 

85 90 95 

Ara Ala Arg Gly Val Gly Ala Gly Arg Arg Arg Asn Gly Leu Gin Thr 

100 105 HO 

Val Ser Ala Asp Leu Ala Ala Asp Leu Ala He Ala Pro Arg Phe Ala 
115 120 I 25 

Ala Gly Asp Arg Val Arg Val Arg Asp Asp Tyr Pro Pro Gly His He 
130 135 I 40 

Arg Thr Pro Val Tyr Val Arg Gly Lys Thr Gly Val Val Thr Arg Cys 
145 150 X55 

Phe Gly Ala Phe Lys Asn Pro Glu Leu Leu Ala He Gly Lys Asp Gly 

165 170 - L/b 

Leu Pro Lys Lys He Leu Tyr Glu Val Arg Phe Lys Gin Thr Asp Leu 

180 I 85 I 90 

Trp Pro Asp Tyr Ala Gly Pro Ala Thr Asp Thr Leu Leu He Asp He 
195 ~ 200 205 



Tyr Glu His Trp Leu Ser Asp Ala 
210 215 



040067 AM 



65 



<210> 77 

<211> 657 

<212> DNA 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M50bD9 

<220> 

<221> CDS 

<222> (1) . . (657) 

<223> 

ltg°iac 7 ggc atg cat gac atg ggc ggc atg cac ggc atg gga ccc att 

Met Asn Gly Met His Asp Met Gly Gly Met His Gly Met Gly Pro He 
1 5 10 15 

■ 

cag ate gag aag gac gag teg ccc ttc cat gcg cgc tgg gaa ggc egg 

Gin He Glu Lys Asp Glu Ser Pro Phe His Ala Arg Trp Glu Gly Arg 

20 25 30 

gcg caa gcg atg tac aac gec att gcg gec acg ggc aga ctg gtg ctt 

Ala Gin Ala Met Tyr Asn Ala He Ala Ala Thr Gly Arg Leu Val Leu 

35 40 45 

ggc ggt aga ccc aca egg gaa ggg ttc ccg ccg gee gaa tat etc cgc 

Gly Gly Arg Pro Thr Arg Glu Gly Phe Pro Pro Ala Glu Tyr Leu Arg 
50 55 60 

atg age tac tat gaa ttg ggt ttc agg gtg ctg gtc gag gac ttg gtc 

Me2 Ser Tyr Tyr Glu Leu Gly Phe Arg Val Leu Val Glu Asp Leu Val 
65 70 75 

ctg aac ggt ttg gtg acg cgc gcg gaa ate acg age ggc cgt ccg gca 

III Asn Gly Leu Val Thr Arg Ala Glu He Thr Ser Gly Arg Pro Ala 

85 90 

aag ggg get gca aag teg acg ccc gca ate acc gec gee ace gcg cag 
Lys Gly Ala Ala Lys Ser Thr Pro Ala He Thr Ala Ala Thr Ala Gin 

y ioo i° 5 110 

gca tat atg ttc gcg etc aaa teg acc egg cga gac gta ccg gtc acg 

Ala Tyr Met Phe Ala Leu Lys Ser Thr Arg Arg Asp Val Pro Val Thr 
115 120 125 

gcg cgt ttc caa gtc ggt cag cgt gtg cgc gcg cgc aac ate aat ccg 
Ala Arg Phe Gin Val Gly Gin Arg Val Arg Ala Arg Asn He Asn Pro 



040067 AM 



66 



130 135 l^O 

gtc acc cat acg cgc ctg ccc cgt tac gcg cgc ggc aaa ttc ggc gtt 

Val Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Gly Lys Phe Gly Val 
145 150 155 160 

ate gaa cgt gac cac ggt gtt tac agg ttc gac gat tec ttt gcc acg 

lie Glu Arg Asp His Gly Val Tyr Arg Phe Asp Asp Ser Phe Ala Thr 

165 170 175 

tec ggc gac gag aag ccc cag cac gtt tat tct gtg cgc ttc gcg gcg 
576 

Ser Gly Asp Glu Lys Pro Gin His Val Tyr Ser Val Arg Phe Ala Ala 

180 I 85 I 90 

cgc gaa eta tgg ggc gaa gcc gcg ccg ccg cga gat get gtc tat ate 

Arg Glu Leu Trp Gly Glu Ala Ala Pro Pro Arg Asp Ala Val Tyr lie 
195 200 205 

gaa ate tgg gat gac aac ctt gag cca gcg tga 
657 

Glu lie Trp Asp Asp Asn Leu Glu Pro Ala 
210 215 



<210> 78 

<211> 218 

<212> PRT 

<213> Unknown 

<223> Metagenome - beta unit nitrile hydratase - M5 0bD9 

<400> 78 

Met Asn Gly Met His Asp Met Gly Gly Met His Gly Met Gly Pro lie 
3. 1 5 10 



5 



0 



Gin lie Glu Lys Asp Glu Ser Pro Phe His Ala Arg Trp Glu Gly Arg 

20 25 30 



Ala Gin Ala Met Tyr Asn Ala He Ala Ala Thr Gly Arg Leu Val Leu 
35 



40 45 



Gly Gly Arg Pro Thr Arg Glu Gly Phe Pro Pro Ala Glu Tyr Leu Arg 
50 55 50 



5 Met Ser Tyr Tyr Glu Leu Gly Phe Arg Val Leu Val Glu Asp Leu Val 
65 70 75 



Leu Asn 



Gly Leu Val Thr Arg Ala Glu He Thr Ser Gly Arg Pro Ala 
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67 



85 



90 95 



10 



15 



Lys Gly Ala Ala Lys Ser Thr Pro Ala He Thr Ala Ala Thr Ala Gin 

^00 3.05 1J - U 

Ala Tyr Met Phe Ala Leu Lys Ser Thr Arg Arg Asp Val Pro Val Thr 
115 120 125 

Ala Arg Phe Gin Val Gly Gin Arg Val Arg Ala Arg Asn He Asn Pro 
130 135 • I 40 

val Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Gly Lys Phe Gly Val 
145 150 155 




0 He Glu Arg Asp His Gly Val Tyr Arg Phe Asp Asp Ser Phe Ala Thr 

165 I 70 

Ser Gly Asp Glu Lys Pro Gin His Val Tyr Ser Val Arg Phe Ala Ala 
25 180 I 85 xyu 

Arg Glu Leu Trp Gly Glu Ala Ala Pro Pro Arg Asp Ala Val Tyr He 
195 200 205 



30 



Glu He Trp Asp Asp Asn Leu Glu Pro Ala 



35 




0 



210 215 



<210> 79 

<211> 696 

<212> DNA 

<213> Unknown 

<220> 



<223> Metagenome - beta unit nitrile hydratase - M3aGlO 



<220> 
45 <221> CDS 

<222> (1) . . (696) 



<223> 



50 



Met Asp Pro Thr Arg Arg Ser Phe Leu Ala Ser Thr Val Ala Leu Thr 

1— "1 fl -L -J 



^g°gat 7 oca acg agg cgt agt ttc otg gcg tot acc gtt gcc ctg acc 
48 

t Asp Pro Thr _ 
1 5 10 

55 ggc ggc'gca got ato ccc gat otg got oat gcg goa gao oao gac oao 

Gly Gly Ala Ala He Pro Asp Leu Ala His Ala Ala Asp His Asp His 

20 25 



040067 AM 



68 

cag cat caa gat ttg ccg tec gat ctg gcg ctg egg gtg aag teg etc 

144 r* r 

Gin His Gin Asp Leu Pro Ser Asp Leu Ala Leu Arg Val Lys Ser Leu 
35 40 45 

gaa teg ctg ctt gtc gag aag ggg ctg gtg gag cga gca gcg etc gac 
192 

Glu Ser Leu Leu Val Glu Lys Gly Leu Val Glu Arg Ala Ala Leu Asp 
50 55 60 

gcg ctg gtg gac acc tac gag cac aaa gtc ggg ccg cga aac gga gcg 

Ala Leu Val Asp Thr Tyr Glu His Lys Val Gly Pre Arg Asn Gly Ala 
65 70 75 

cgc gtt gtc gcg egg gee tgg gtt gac ccg gac tac aag caa egg tta 

n o o 

Arg Val Val Ala Arg Ala Trp Val Asp Pre Asp Tyr Lys Gin Arg Leu 

85 90 

ttc gcg aac ggt acc gee gca gtc gcg gag ttc ggc tac tec ggc teg 

III Ala Asn Gly Thr Ala Ala Val Ala Glu Phe Gly Tyr Ser Gly Ser 

100 105 

cag ggc get gac ate egg gtc gtc gaa aac acg gee act gta cat aac 

Gin Gly Ala Asp He Arg Val Val Glu Asn Thr Ala Thr Val His Asn 
115 120 125 

etc gtc gtg tgc acg ctg tgc tct tgt tat ccc tgg ccg gtg ctg ggc 

til val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly 

130 I 35 140 

ttg ccg ccg gtc tgg tac aag tec gcg ccc tat egg tct cgc gtg gtg 

Leu Pro Pro Val Trp Tyr Lys Ser Ala Pro Tyr Arg Ser Arg Val Val 
145 150 

ate gat ccg cga ggt gtg ctg cgc gag ttc ggc gtg. gtg ctg ccg gac 

lie Asp Pro Arg Gly Val Leu Arg Glu Phe Gly Val Val Leu Pro Asp 

165 170 Xl ° 

eat ate gaa gtg cgt gtc tat gac age acg gcg gag caa cgc tat eta 

hIs He Glu Val Arg Val Tyr Asp Ser Thr Ala Glu Gin Arg Tyr Leu 

180 I 85 xyu 

gtg ctg ccg gag egg ccg gee gga acc gaa aac ctg aca gaa gaa gcg 

Vax Leu Pro Glu Arg Pro Ala Gly Thr Glu Asn Leu Thr Glu Glu Ala 
195 200 205 

ctg gcg ctg ctg gtg acg cgc gac gcg atg att ggc gtg gee aag gtc 

Leu Ala Leu Leu Val Thr Arg Asp Ala Met He Gly Val Ala Lys Val 

215 220 



210 



040067 AM 



69 



gcg ccg ccg gga ggc cgc gga tga 
696 

Ala Pro Pro Gly Gly Arg Gly 



<210> 80 

<211> 231 

10 <212> PRT 

< 2 1 3 > Unknown 



15 




0 



25 



<223> Metagenome - beta unit nitrile hydratase - M3aG10 
<400> 80 

Met Asp Pro Thr Arg Arg Ser Phe Leu Ala Ser Thr Val Ala Leu Thr 
1 5 10 15 

Gly Gly Ala Ala lie Pro Asp Leu Ala His Ala Ala Asp His Asp His 



20 



Gin His Gin Asp Leu Pro Ser Asp Leu Ala Leu Arg Val Lys Ser Leu 
35 40 4 5 



3 0 Glu Ser Leu Leu Val Glu Lys Gly Leu Val Glu Arg Ala Ala Leu Asp 

50 



55 60 




Ala Leu Val Asp Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala 
35 65 70 75 

Arg Val Val Ala Arg Ala Trp Val Asp Pro Asp Tyr Lys Gin Arg Leu 

85 90 

0 

Phe Ala Asn Gly Thr Ala Ala Val Ala Glu Phe Gly Tyr Ser Gly Ser 

100 105 

45 Gin Gly Ala Asp He Arg Val Val Glu Asn Thr Ala Thr Val His Asn 



115 120 



50 Leu Val Val Cys Thr Leu Cys Ser Cys Tyr Pro Trp Pro Val Leu Gly 

130 



135 140 



Leu pro Pro Val Trp Tyr Lys Ser Ala Pro Tyr Arg Ser Arg Val Val 
55 145 150 155 

He Asp Pro Arg Gly Val Leu Arg Glu Phe Gly Val Val Leu Pro Asp 

165 1/u 



040067 AM 



70 



His lie Glu val Arg Val Tyr Asp Ser Thr Ala Glu Gin Arg Tyr Leu 

180 185 190 



Val Leu Pro Glu Arg Pro Ala Gly Thr Glu Asn Leu Thr Glu Glu Ala 

200 205 



195 



10 



Leu Ala Leu Leu Val Thr Arg Asp Ala Met lie Gly Val Ala Lys Val 
210 215 220 



15 Ala Pro Pro Gly Gly Arg Gly 
225 230 




<210> 
<211> 
<212> 
<213> 



81 

327 

DNA 

Unknown 



<220> 

25 <223> Metagenome - pl2K unit 



30 



<220> 
<221> 
<222> 
<223> 



CDS 
(1) 



. (327) 



35 




45 



50 



55 



<400> 81 4-4-a- 
atg aaa gat age ccg gtc ttt ogc gag ccg tgg gaa gcg cag gcg ttt 

Met Lys Asp Ser Pro Val Phe Arg Glu Pro Trp Glu Ala Gin Ala Phe 
1 5 1° X 

gcg ttg gcg ate teg ttg caa gac cgt ggc gtg ttc acg cga gac gaa 

"a Leu Ala lie Ser Leu Gin Asp Arg Gly Val Phe Thr Arg Asp Glu 

' 20 25 30 



tgg gcg gcg gca 

Trp Ala Ala Ala 
35 

gat ccc gat acg 
192 

Asp Pro Asp Thr 
50 

gaa egg ctg att 
240 

Glu Arg Leu He 
65 

cgc aca cgc gac 
288 



etc ggc gat gaa ate aag aag gcg caa get gec ggc 

Leu Gly Asp Glu He Lys Lys Ala Gin Ala Ala Gly 

40 45 

ggc gag act tat tac cat cat tgg atg gca gcg etc 

Glv Glu Thr Tyr Tyr His His Trp Met Ala Ala Leu 
55 60 

gca gec aag ggt gtt gec gat acg cag acg etc gcg 

Ala Ala Lys Gly Val Ala Asp Thr Gin Thr Leu Ala 
70 75 80 

gec tgg cag cac gec tgt gcg cga acg ccg cat ggc 



040067 AM 



71 

Arg Thr Arg Asp Ala Trp Gin His Ala Cys Ala Arg Thr Pro His Gly 

85 90 95 

gcg cca ate gag eta aga ccg gac gac ttc agg aat tga 
327 

Ala Pro He Glu Leu Arg Pro Asp Asp Phe Arg Asn 

100 i05 



<210> 82 

<211> 108 

<212> PRT 

<213> Unknown 

<220> 

<223> Metagenome - pl2K unit 
<400> 82 

Met Lys Asp Ser Pro Val Phe Arg Glu Pro Trp Glu Ala Gin Ala Phe 
15 10 15 

Ala Leu Ala He Ser Leu Gin Asp Arg Gly Val Phe Thr Arg Asp Glu 

20 25 30 

Trp Ala Ala Ala Leu Gly Asp Glu He Lys Lys Ala Gin Ala Ala Gly 
35 40 45 

Asp Pro Asp Thr Gly Glu Thr Tyr Tyr His His Trp Met Ala Ala Leu 
50 55 60 

Glu Arg Leu He Ala Ala Lys Gly Val Ala Asp Thr Gin Thr Leu Ala 
65 70 75 »u 

Arg Thr Arg Asp Ala Trp Gin His Ala Cys Ala Arg Thr Pro His Gly 



85 



90 95 



Ala Pro He Glu Leu Arg Pro Asp Asp Phe Arg Asn 

100 105 



<210> 83 

<211> 321 

<212> DNA 

<213> Unknown 

<220> 

<223> Metagenome - pl2K unit 
<220> 

<221> CDS 

<222> (1) • - (321) 

<223> 
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72 



<400> 83 

atg aga aca gtt get gag caa ate gcg get gat ctt gcg agt ccg gcg 
48 

Met Arg Thr Val Ala Glu Gin lie Ala Ala Asp Leu Ala Ser Pro Ala 
1 5 10 15 

gcg att ccg cgc cgc aac ggc gag ccg gtc ttc gac gag cct tgg gaa 

Ala lie Pro Arg Arg Asn Gly Glu Pro Val Phe Asp Glu Pro Trp Glu 

20 25 30 

agt cgt gcg ttt ggg ata gcg gtc gec ctt tec gag ggt ggc etc tat 

144 „ 
Ser Arg Ala Phe Gly He Ala Val Ala Leu Ser Glu Gly Gly Leu Tyr 
35 40 45 

tea tgg gat gaa ttt cgc gat tgc ctg att get gaa ate aca gcg gcg 
192 

Ser Trp Asp Glu Phe Arg Asp Cys Leu He Ala Glu He Thr Ala Ala 
50 55 60 

gat gcg cgc ggc gag cat acg age tat tac gaa egg ttt etc gee gee 
240 

Asp Ala Arg Gly Glu His Thr Ser Tyr Tyr Glu Arg Phe Leu Ala Ala 
65 70 75 bo 

ctg cag cat ctg etc gcg gec aaa cgc etc tgc act ccc gat gaa gtc 
2 88 

Leu Gin His Leu Leu Ala Ala Lys Arg Leu Cys Thr Pro Asp Glu Val 

85 90 95 

gag egg egg atg aac act age gca ggc acc tga 
321 

Glu Arg Arg Met Asn Thr Ser Ala Gly Thr 

100 105 



<210> 84 

<211> 106 

<212> PRT 

<213> Unknown 

<220> 

<223> Metagenome - pl2K unit 
<400> 84 

Met Arg Thr Val Ala Glu Gin lie Ala Ala Asp Leu Ala Ser Pro Ala 
1 5 10 

Ala lie Pro Arg Arg Asn Gly Glu Pro Val Phe Asp Glu Pro Trp Glu 

20 25 30 

Ser Arg Ala Phe Gly He Ala Val Ala Leu Ser Glu Gly Gly Leu Tyr 
35 40 45 



040067 AM 



73 



Ser Trp Asp Glu Phe Arg Asp Cys Leu He Ala Glu He Thr Ala Ala 
50 55 60 

Asp Ala Arg Gly Glu His Thr Ser Tyr Tyr Glu Arg Phe Leu Ala Ala 
65 70 75 

Leu Gin His Leu Leu Ala Ala Lys Arg Leu Cys Thr Pro Asp Glu Val 

85 90 95 



Glu Arg Arg Met Asn Thr Ser Ala Gly Thr 

100 i° 5 



<210> 85 

<211> 426 

<212> DNA 

< 2 1 3 > Unknown 

<220> 

<223> tfEetagenome - pl2K unit 
<220> 

<221> CDS 

<222> (1) . . (426) 

<223> 

at^aca'acc ttg age cag cgt gaa gcg gec ccc teg gee gag ett ett 

Met Thr Thr Leu Ser Gin Arg Glu Ala Ala Pro Ser Ala Glu Leu Leu 

5 10 15 

gae eta ceg caa ett eca age gac ace gac gge cec gtc ttc gcg gaa 

isp Leu Pro Gin Leu Pro Ser Asp Thr Asp Gly Pro Val Phe Ala Glu 

20 25 

eet tgg gaa geg gaa geg ttt geg ett gee gta agt ett tea gag eaa 
Pro Trp Glu Ala Glu Ala Phe Ala Leu Ala Val Ser Leu Ser Glu Gin 

gga eat tte acg tgg aag gaa tgg gea gea aeg ete gee gat gaa ctg 

Gly His Phe Thr Trp Lys Glu Trp Ala Ala Thr Leu Ala Asp Glu Leu 
50 55 6 



gag gge gee gee aat cgc gge gag ceg gat gac ggt acg cat tat tat 

lil Gly Ala Ala Asn Arg Gly Glu Pro Asp Asp Gly Thr His Tyr Tyr 
65 70 75 

gag tac tgg ctg acg gee ctg gaa agg ctg gtt acg ate aag gge ctg 
III Tyr Trp Leu Thr Ala Leu Glu Arg Leu Val Thr He Lys Gly Leu 



040067 AM 



74 



85 90 



95 



aca gat cag caa gcg atg cgc gag cgc aaa gag gcg tgg gaa gaa gcc 

Thr Asp Gin Gin Ala Met Arg Glu Arg Lys Glu Ala Trp Glu Glu Ala 

100 105 11° 



tat cgc cat acc ccg cat ggc gcg cca gtt gaa ctt atg tct ccg etc 
3 84 

Tyr Arg His Thr Pro His Gly Ala Pro Val Glu Leu Met Ser Pro Leu 



gat caa age egg ata gcc gaa gag gac age gaa tec tea tag 
42 6 

Asp Gin Ser Arg He Ala Glu Glu Asp Ser Glu Ser Ser 
130 135 1^0 



<210> 86 

<211> 141 

<212> PRT 

<213> Unknown 



<220> 

<223> Metagenome - pl2K unit 
<400> 86 



Met Thr Thr Leu Ser Gin Arg Glu Ala Ala Pro Ser Ala Glu Leu Leu 
1 5 1° 

Asp Leu Pro Gin Leu Pro Ser Asp Thr Asp Gly Pro Val Phe Ala Glu 



Pro Trp Glu Ala Glu Ala Phe Ala Leu Ala Val Ser Leu Ser Glu Gin 
35 40 45 

Gly His Phe Thr Trp Lys Glu Trp Ala Ala Thr Leu Ala Asp Glu Leu 
50 55 

Glu Gly Ala Ala Asn Arg Gly Glu Pro Asp Asp Gly Thr His Tyr Tyr 
65 70 75 

Glu Tyr Trp Leu Thr Ala Leu Glu Arg Leu Val Thr He Lys Gly Leu 



85 



Thr Asp Gin Gin Ala Met Arg Glu Arg Lys Glu Ala Trp Glu Glu Ala 

100 105 

„, _ „ u j 0 ji, Pr . n val Glu Leu Met Ser Pro Leu 

Tyr Arg His Thr Pro His Gly Aia fro vax ucu. 



115 



120 
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75 



Asp Gin Ser Arg He Ala Glu Glu Asp Ser Glu Ser Ser 
130 135 



